【話題】ＮＴＴがＡＩに「視覚読解」の能力を付与、文書画像から質問に回答する技術を確立

Home
話題, プレスリリース
【話題】ＮＴＴがＡＩに「視覚読解」の能力を付与、文書画像から質問に回答する技術を確立

【話題】ＮＴＴがＡＩに「視覚読解」の能力を付与、文書画像から質問に回答する技術を確立

2024/4/12 14:11
話題, プレスリリース

■大規模言語モデル「ｔｓｕｚｕｍｉ」で実現、オフィスワークや日常生活を支援

　近年、ＡＩ技術は目覚ましい発展を遂げているが、従来のＡＩはテキスト情報しか理解できないという課題があった。ＮＴＴ（日本電信電話）＜９４３２＞（東証プライム）は４月１２日、大規模言語モデル「ｔｓｕｚｕｍｉ」を用いて、文書画像に含まれる視覚情報も理解できる「視覚読解技術」を開発したと発表。同技術により、ＡＩは文書画像を提示されただけで、あらゆる質問に回答することが可能となる。

　私たちが扱う文書は、テキスト情報だけでなく、図表や写真などの視覚情報も含まれている。しかし、従来のＡＩはテキスト情報しか理解できず、視覚情報を取り込んだ文書を理解することは困難だった。そこでＮＴＴは、視覚情報も理解できるＡＩの実現を目指し、研究開発を進めてきた。

　大規模言語モデル「ｔｓｕｚｕｍｉ」を用いて、視覚情報も理解できる「視覚読解技術」を開発。文書画像をＬＬＭの表現に変換するアダプタ技術と、多様な視覚読解タスクを対象とした指示遂行データセットの構築によって実現した。ＡＩは文書画像を提示されただけで、あらゆる質問に回答することが可能となる。例えば、請求書から必要な情報を抽出したり、専門文献から特定の情報を見つけたりすることができる。

　ＮＴＴは、この技術を基に、視覚表現された文書を基に質問応答を行う技術やＷｅｂ検索など、産業上重要なサービスの発展に貢献していく予定。また、作業自動化をはじめ、ヒトと協働し、価値を生み出すＡＩの実現に向けて技術確立をめざしていく。同成果は、２０２３年度における東北大学データ駆動科学・ＡＩ教育研究センターの鈴木潤教授との共同研究の成果となる。（情報提供：日本インタビュ新聞社・Media-IR 株式投資情報編集部）

ＡＢＥＪＡは後場２０％高、朝方の１３％安から急伸、第２四半期３か月間の好調を見直す

富士フイルムが北米新拠点に１８００億円投資、抗体医薬品の生産能力増強へ

カテゴリー別記事情報

ピックアップ記事

2024/10/5
株は千里を行って千里を帰る＝犬丸正寛の相場格言

【先人の教えを格言で解説！】（犬丸正寛＝株式評論家・平成２８年：２０１６年）没・享年７２歳。生前に…
2024/10/4
人手不足倒産が過去最多を更新！深刻化する人材不足、賃上げに向けた課題も

■２０２４年度上半期１６３件で過去最多更新　人手不足による倒産が急増している。帝国データバンクの…
2024/10/3
トヨタ、空飛ぶクルマ実現へＪｏｂｙ　Ａｖｉａｔｉｏｎに５億ドル追加出資

■新たなモビリティ社会実現に向けた取り組み加速　トヨタ自動車＜７２０３＞（東証プライム）は１０月…

2024年11月
月	火	水	木	金	土	日
	1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

ピックアップ記事

【株式市場特集】インバウンド関連株に注目、電鉄株が好材料で急騰

■化粧品大手は業績下方修正も、電鉄各社は上方修正で活況　トランプ次期大統領の影響を受けない純内需…
【どう見るこの相場】トランプ・トレードの期待と不安の綱引き、円安加速で株式市場うねる

■金利敏感株の次は円安メリット株？！インバウンド関連株に「トランプ・トレード」ローテーション　米…
【株式市場特集】地銀株、業績上方修正と株主還元で存在感増す

■金利上昇追い風に地銀株が躍進、政策期待も後押し　金利上昇の影響を受けて銀行株、特に地方銀行株の…
【どう見るこの相場】マーケットはトランプ勝利で「黄金時代」先取り－減税・規制緩和に期待感

■トリプルセット行、ダブルセット行も相次ぐ地銀銀株は決算プレイで「トランプトレード」へキャッチアップ…

アーカイブ

「日本インタビュ新聞社」が提供する株式投資情報は投資の勧誘を目的としたものではなく、投資の参考となる情報の提供を目的としたものです。投資に関する最終的な決定はご自身の判断でなさいますようお願いいたします。
また、当社が提供する情報の正確性については万全を期しておりますが、その内容を保証するものではありません。また、予告なく削除・変更する場合があります。これらの情報に基づいて被ったいかなる損害についても、一切責任を負いかねます。

ページ上部へ戻る