サイバーエージェントが独自の日本語LLMに視覚を付与したVLM(大規模視覚言語モデル)を一般公開
- 2024/6/13 16:40
- プレスリリース
■日本語LLMの「CyberAgentLM2」に視覚機能を付与した画期的なモデル
サイバーエージェント<4751>(東証プライム)は6月13日、日本語に特化した75億パラメータの視覚言語モデル「CyberAgentLM2」を公開したと発表。このモデルは、画像とテキストを組み合わせた対話AIの開発を可能にし、商用利用も可能。
近年、画像を扱うことができるLLMの進化が著しく、特にOpenAI社の「GPT-4o」が注目されている。しかし、既存のVLMは英語中心であり、日本文化や日本語に強いモデルは少ない。そこで、サイバーエージェントは日本語VLMの開発に着手し、その成果として「CyberAgentLM2」をHugging Face Hubにて公開した。
公開されたモデルは、社内の高性能な日本語LLMで合成されたデータセットを用いて学習され、Apache-2.0ライセンスの下で提供される。これにより、日本語の視覚言語モデルに関する研究開発が促進されることが期待される。さらに、研究用に開発された高性能なモデルのデモも公開されており、国内の視覚言語モデルの発展に貢献することを目指していく。(情報提供:日本インタビュ新聞社・Media-IR 株式投資情報編集部)