2024/3/1
2024年2月9日(金)、「ポスト5G情報通信システム基盤強化研究開発事業/競争力ある生成AI基盤モデルの開発」に採択された事業者のコミュニティKick Offイベントが、東京都千代田区のワテラスコモンで開催されました。
本イベントには、第1期採択の7事業者が参加。交流を深めることを目的に、コミュニティの役割や今後の活動などを共有しながら、事業者同士の親睦を深めました。本記事では、当日の内容の一部を紹介します。
〝基盤モデル〟の開発力強化が、日本のイノベーションの鍵
はじめに、齋藤健 経済産業大臣からのビデオレターが紹介されました。齋藤大臣は、生成AIは自動車やパソコン、スマホのように次なる進化のキーテクノロジーであること、官民で開発力の強化を行い、持続的な進化を生み出していくことが重要だと話しました。
「新しい産業の振興には、関係者間の連携を図り、内向きではなく、組織や国境の垣根を越えて、外から新しいアイデアや異なる視点を積極的に取り入れることが鍵です。失敗を恐れずに挑戦して欲しい。ここにお集まりの皆様にぜひ世界に打って出て、新たな社会のリーダーとなっていただくことを期待して、私からのご挨拶をさせていただきます」(齋藤健経済産業大臣)。
次に、経済産業省ソフトウェア情報サービス戦略室長渡辺氏が、GENIACプログラムについて説明しました。日本は今、自然災害、交通事故、フードロス、経済格差、長時間労働や人手不足、教育格差、医療問題、デジタル赤字の拡大など、多くの課題を抱えています。これらの課題解決に大きな期待が寄せられているのがAIです。
「日本が安全に幅広い分野でAIを利用し、イノベーションを創出し続け、豊かで誇るべき国となる。そのためには、生成AIの開発力が重要であり、ここにお集まりの皆様のような高度なソフトウェア開発人材の活躍が欠かせません。日本の生成AIの持続的な開発力の確保に向けて、生成AIの開発力の底上げを図るとともに、それぞれのビジネス主体が創意工夫し挑戦できる環境を作ることが本プログラムの目的です」(経済産業省ソフトウェア情報サービス戦略室長渡辺氏)。
次に渡辺氏は、生成AIの開発力を強化するための要素として「計算資源」「データ」「ナレッジ」の3つが重要であり、それらに対し支援をしていくこと説明しました。
主な支援内容
-
計算資源
生成AIのコア技術である基盤モデルを開発する上で確保しなければならないGPUなどの調達を支援。
-
データ
データ活用に向けた支援プログラムなどを通じて、ユーザーなどデータ保有者との連携を促進。
-
ナレッジ
イベントやコミュニケーションツールによって、国内外の開発者同士や政府の各種制度担当者との交流を促進。3月下旬から4月上旬には、海外の開発者との交流を目的として、Googleの基盤モデル開発者が登場するイベントを予定。
国内外の知見をコミュニティに集結し、日本の開発力向上へ
生成AIの鍵を握るのが、様々なサービスを支えるコアとなる技術基盤「基盤モデル開発」。この開発力の有無が、我が国における生成AIの利用可能性、創出するイノベーションの幅を決めると言っても過言ではありません。
日本全体で基盤モデルの開発を牽引していくためには、本来ライバル関係である事業者間の垣根を超えて、ナレッジを共有していくことが必要です。そのために、コミュニティ内では、「1.計算資源の提供」「2.利活用企業やデータホルダーとのマッチング」「3.グローバルテック企業との連携・開発者間での知見共有」を行っていきます
コミュニティは、大きく2つのグループから構成されています。 「A.採択事業者のみのコミュニティ」では、GENIACにおける計算資源の提供支援内での開発ノウハウの共有をメインに、開発環境の整備手法や性能評価の効率的な実施方法などを議論していきます。
「B.採択事業者以外も含めた開発事業者コミュニティ」では、基盤モデル開発における開発ノウハウなどを広く共有していくことで、日本の開発力の底上げを行っていくことを目指します。
GENIACコミュニティで掲げているコンセプトは、「共有知の在り方を創る」「パートナーシップの在り方を創る」「ルールの在り方を創る」の3つ。それぞれ、日本からイノベーションを起こすために欠かせない要素です。
コミュニティにおける3つのコンセプト
-
共有知の在り方を創る
開発事業者間での情報知見を共有し、積極的なコミュニティの発信を行う。
-
パートナーシップの在り方を創る
実際にAIを利用する企業、基盤モデルの上でアプリケーション開発を行う企業とのマッチングイベントの開催など。
-
ルールの在り方を創る
社会実装を進める上で、どういった規制やルールがハードルになるのかを検討、提言する。
これら3つのコンセプトをもとに、GENIACコミュニティでは、次のような取り組みを行っていきます。
コミュニティの取り組み内容
-
グローバルテック企業・アカデミアを招いたセミナーの実施
基盤モデルの開発を行う企業を招き、どのような基盤モデルを開発しているのか、今後の展望を共有し、ディスカッションする。
-
開発者間でのノウハウの共有・議論を通じた相互支援
個別の議論の場、成果報告会など、一連の開発の中で得られた成功だけで無く、どのようなチャレンジや失敗があったか、成果を発表する。
-
ベストプラクティスの収集・蓄積
Slackを使い、知見やノウハウを共有、ディスカッションする。そのやり取りをベストプラクティスとしてやNotionに蓄積。
-
開発企業―利活用企業・アプリケーション企業等とのマッチング
社会実装に向けて、エンドユーザーや開発事業者とのマッチングイベントを実施する。
採択事業者の多種多様なAI開発の取り組み
コミュニティの役割などの説明の後は、今回採択された7事業者が、現在の取り組みや今後の展望について語りました。
株式会社ABEJA
株式会社ABEJAは、企業のDX推進を、導入から運用までを総合的にサポートしています。同社では、DXの実行に必要なデータの生成・収集・加工・分析、AIモデリングまでのプロセスを提供。「ABEJA Platform」を核に、トランスフォーメーションとオペレーションをより効率的に行えるよう、企業を支援しています。
「会社の経営理念である『ゆたかな世界を、実装する』の実現に向けて、社員一同、思いをともにして社会に貢献できればと思っております。弊社では日本語のLLMの精度を上げるとともに、コストパフォーマンスの改善を目指しています。それによって、社会実装化を加速させていきたいです」(経営戦略統括部 部長 木下 正文氏)。
Sakana AI 株式会社
ディープラーニングの分野では誰もが知るトップレベルの研究者たちが創設した、Sakana AI 株式会社。同社では、小規模なモデルを多数連携させることで、環境に柔軟に対応する「適応的なA I」の開発を目指しています。
「今回のプロジェクトでは、まずは小さいモデルで高い性能を出すことに取り組んでいきたいと考えています。もう一つが、会話テキストに基づいたものの一歩先として、エージェントとなり、Language Modelが実際に自分で行動し、自分自身で問題を解決していくことを実現したいです」(Sakana AI 株式会社 秋葉 拓哉氏)。
大学共同利用機関法人 情報・システム研究機構(国立情報学研究所)
国立情報学研究所では、「オープンかつ日本語に強いGPT-3級大規模言語モデルの構築」に取り組んでいます。2023年5月からは、趣旨に賛同した人なら誰でも参加できる「LLM-jp(LLM勉強会)」を立ち上げ、モデル・データ・ツール・技術資料等を議論の過程・失敗を含めすべて公開する取り組みを行ってきました。
「今回我々は、175ビリオン(パラメータ)の大規模言語モデルを作ることに挑戦したいと思っています。構築したモデル、ソースコード、開発のノウハウ、失敗も含めて全て公開します。それから、企業や大学と勉強会等で知見を共有し、日本の開発力の底上げに寄与したいと考えています」(黒橋 禎夫氏 国立情報学研究所 所長/京都大学 特定教授)。
ストックマーク株式会社
2016年に創業したストックマーク株式会社では、自然言語処理技術を活用したビジネス意思決定サービスの提供を行っています。2023年10月には、130億パラメータの日本語LLMを公開しました。
「ラストワンマイルのハルシネーションをなくすことは、とても大事な部分です。人間社会として区別していく必要があるような概念を徹底的に教え込むことで、ハルシネーションを抑止し、本当に仕事で使えるような基盤モデルを作っていきます。さらに、正確さだけでなく、自分でアイデアを出すようなものも作っていきたいです」(ストックマーク株式会社 取締役CTO 有島 幸介氏)。
Turing株式会社
Turing株式会社は、ハンドルがない完全自動運転EV、電気自動車の開発を行っているスタートアップ企業です。LLMと視覚情報を組み合わせた「マルチモーダルAI」の開発を重点的に進めています。
「人間が運転するのと同じように運転をするAIを作りたいと考えています。人間のように理解する頭と、目を兼ね備えたようなものです。運転の環境には、稀な状況(ロングテール)がたくさんあります。アルゴリズムベースだけで対応するには限界があるため、今回のプロジェクトでは、特に日本の交通環境に適合したようなマルチモーダルAIを作っていきます」(Turing株式会社 AI開発担当 山口 祐氏)
国立大学法人 東京大学 松尾・岩澤研究室
東京大学 松尾・岩澤研究室では、「基礎研究」「講義」「社会実装」「インキュベーション」の4つの活動を循環させ、「世界で戦える技術大国のエコシステムをつくる」ことを目標に掲げています。
「本プロジェクトでは、多様な日本語能力の向上を目指した公開型の基盤モデル開発に取り組みます。ポイントは大きく二つ。一つは小さめの14から50ミリオンの、多様な基盤モデルを開発すること。もう一つが、講義を修了した人からメンバーを選抜し、LLMの開発経験を積んだ人を育成していくことです」(岩澤 有祐氏)。
株式会社Preferred Elements
LLM、マルチモーダル基盤モデルの開発を行っている株式会社Preferred Elements。同社が所属するPreferred Networksグループでは、スーパーコンピューターを保有し、計算基盤となるチップの開発も行っており、基盤からアプリケーションまでを提供できる垂直統合型のビジネス構造を目指しています。
「今回のプロジェクトでは、1,000億パラメータのマルチモーダル基盤モデルの開発を行い、言語に加えて、画像・音声にも対応し、世界最高レベルの性能を目指します。もう一つの目標が、1兆パラメータの言語モデルの開発の検証を進めることです。事前学習済みモデルの公開や開発ノウハウを公開し、開発力の底上げに寄与できたらと思っています」(株式会社Preferred Elements 代表取締役社長 岡野原 大輔氏)。
テーマトークとフリートークで親睦を深め、知見を共有
イベントの後半では、参加者が交流する機会が設けられました。「ワールドカフェトーク」では、テーブルごとにテーマを決め、関心のある話題ごとに参加者がフリートーク。各テーブルで活発な議論が行われました。
その後の懇親会では、よりフランクに事業者同士が自由に会話を行い、交流を深めました。
GENIACコミュニティでは、国内のAI技術の底上げを図るため、今後もさまざまな活動を行っていきます。日本から世界に誇るイノベーションが誕生する日も、近いかもしれません。
GENIACトップへ最終更新日:2024年5月23日