■スーパーコンピュータ「富岳」の力で大規模言語モデルが革新!
東京工業大学、東北大学、富士通<6702>(東証プライム)、理化学研究所の4者は、政府の「富岳」政策対応枠を活用して、スーパーコンピュータ「富岳」を利用した大規模言語モデルの分散並列学習手法に関する研究開発を2023年5月から実施している。この研究開発の成果物を公開することで、学術界や企業が幅広く活用できる大規模言語モデルの構築環境を整備し、国内のAI研究力向上に貢献することを目指している。
■効率的なデータ処理がもたらす社会変革に期待高まる
大規模言語モデルは、ChatGPTを含む生成AIの基盤となる深層学習技術であり、社会全体の変革やSociety5.0における研究開発、経済社会、安全保障などの領域で期待されている。しかし、大規模言語モデルの性能向上には、高性能な計算資源による効率的なデータ処理が不可欠。
そこで、4者は、「富岳」政策対応枠において、スーパーコンピュータ「富岳」を活用した大規模言語モデルの分散並列学習手法の研究開発に着手した。東工大は全体を総括し、大規模言語モデルの並列化と高速化に取り組む。東北大は学習用データの収集やモデルの選択に関与する。富士通は大規模言語モデルの高速化に取り組み、理化学研究所は大規模言語モデルの分散並列化と通信高速化、さらに高速化に注力していく。各機関・企業が役割を担いながら、効率的な大規模言語モデルの実行を可能にする技術の開発を目指している。
この研究開発は2023年5月24日から2024年3月31日までの期間、「富岳」政策対応枠を利用して行われる。研究成果は2024年度にGitHubやHugging Faceなどを通じて公開される予定で、日本の研究者やエンジニアが大規模言語モデルの開発に積極的に取り組む環境を整備することが期待されている。
また、今後は東海国立大学機構名古屋大学やサイバーエージェント<4751>(東証プライム)との連携も検討されており、マルチモーダル化や産業分野への応用を促進するためのデータ生成手法や学習手法の開発にも取り組まれる。
この研究開発により、効率的な大規模言語モデルの構築が進み、学術や産業の両面で「富岳」の活用価値が高まることが期待される。さらに、多くの研究者や技術者が参画することで新たな革新的な研究やビジネスの成果が生まれ、次世代の社会に貢献する可能性も秘めている。(情報提供:日本インタビュ新聞社・株式投資情報編集部)