1. ホーム
  2. 地球環境を「理解」する特化型AI開発に挑んだJAMSTECが目指す環境知の新たな活用の地平 国立研究開発法人海洋研究開発機構(JAMSTEC) 上席研究員 松岡 大祐

地球環境を「理解」する特化型AI開発に挑んだJAMSTECが目指す環境知の新たな活用の地平 国立研究開発法人海洋研究開発機構(JAMSTEC) 上席研究員 松岡 大祐

未来を創る生成AIに挑む挑戦者たち

2025/12/25

国産の生成AI研究開発に挑む、GENIAC採択事業者たち。そのキーパーソンは何を見据え、どこに活路を見いだしているのでしょうか。今回は、第2サイクルで海洋・地球分野での特化型生成AIの構築に取り組んできたJAMSTECの松岡 大祐氏に、研究の原点から計算資源の課題、GENIACでの学びと社会実装の展望を伺いました。


<プロフィール>

松岡 大祐(まつおか だいすけ)
1979年生まれ、山口県出身 。国立研究開発法人海洋研究開発機構(JAMSTEC)データサイエンス研究グループ 上席研究員。高専で情報工学を学んだのち、愛媛大学大学院理工学研究科で博士号(工学)を取得。在学中に「地球シミュレータ」で宇宙プラズマのシミュレーションやデータ可視化に携わり、2009年よりJAMSTECに入職。海洋・地球分野の画像認識やデータ解析へ領域を拡張し、2022年にデータサイエンス研究グループが設立され、グループリーダーに着任。現在は特化型生成AIの研究開発と社会実装に注力している。


瀬戸内の島で芽生えた情報科学への関心

──松岡さんが工学部情報系に進まれた原点を教えてください。

松岡:私は山口県出身で、瀬戸内海の島で育ちました。幼少期に父が買ってくれたMS-DOS機でBASICを“写経”した体験があるのですが、当然ながら一文字でも間違えればエラーが出るなど、最初はプログラミングが嫌いになったほどです。

プログラミングやコンピュータに苦手意識をもっていたものの、あまり深く考えず地元の大島商船高等専門学校の情報工学科を進学先に選びました。商船高専は海運に関わる人材を育成する国内に5校しかない珍しい学校なのですが、普段は毎週プログラミングの実習があるなど、海とは直接関係のない勉強が多かったです。

一方で、寮生活で偶然『Newton』などの科学雑誌に触れたことで宇宙や地球への関心が強まり、研究者の仕事を知るきっかけにもなりました。高専から愛媛大学の工学部に編入することも決まっていたのですが、情報工学科にあった宇宙の研究をテーマとする研究室を希望し、そのまま大学院博士課程まで情報科学的なアプローチで宇宙の研究をしていました。

──宇宙への興味から、地球環境や海洋を研究するJAMSTECに入職された理由は何でしょうか?

松岡:大学在学中に宇宙プラズマ(太陽フレア・地球磁気圏のオーロラ爆発など)の大規模な数値シミュレーションを用いた研究をしており、当時からここ(横浜研究所)にある初代の「地球シミュレータ」というスパコンを使っていたという経緯もあります。

この研究では、シミュレーションそのものだけでなく、周辺技術である並列化や大規模データの転送、可視化についても非常に重要な要素になります。ここで得られた知識やスキルは宇宙だけでなく地球や海洋でも活かせると考え、JAMSTECに応募しました。元々自分にとって海は身近な存在であったことも、影響していたのかもしれません。

──JAMSTECという国立の研究機関の役割と、現在の松岡さんの研究内容について改めて教えてください。

松岡:はい。1971年に設立されたJAMSTECは、文部科学省所管の国立研究開発法人の一つです。とりわけ、海洋・地球・生命に関する統合的な理解と、研究開発によって得られた成果を、世界平和や社会課題の解決に役立てることを目指している機関です。

研究者のほとんどは海洋や気象など地球科学の専門家ですが、私自身は数少ない情報系の専門家として「地球シミュレータセンター」という部署で、シミュレーションや観測で得られた生のデータを可視化・映像化し、学術的な理解や伝達に活かすという仕事をしてきました。例えば、海の渦や空の雲を特徴毎に分類し動きを追跡したり、していました。

2016年頃からAI研究の必要性を感じ始め水面下で人を集めて勉強会を開催したり研究を実施したりしていましたが、2022年にようやくデータサイエンス研究グループが設置され、正式な体制として動き出しました。「生成AI」が比重を増したのはここ1〜2年で、それ以前はシミュレーションデータや衛星観測データやウェブカメラの映像データ等を用い、海洋プラスチックや海底地形、気象などを対象とした画像認識での機械学習活用が中心でした。

特化型モデルが拓く「一人で進められる分析」

──JAMSTECが運用する地球シミュレータは強力な計算資源だと思いますが、生成AIモデルの開発には何か制約があったのでしょうか。

松岡:地球シミュレータは、一般的にイメージされるCPUを超並列接続したスーパーコンピュータではなく、「ベクトルプロセッサ」と呼ばれる特別なアーキテクチャを中心としてCPUやGPUも搭載したマルチアーキテクチャ型を採用しています。AI開発にも適したGPUが搭載されたのは現在の第4世代目に更新された2021年からですが、当時はまだ実績が少なかったこともありNVIDIA社製のGPU A100が64基しか載っていませんでした。

地球シミュレータは数年間のリース契約で運用されているため、最新のGPUアーキテクチャを常に導入するということができません。そのため、目的によってはグループで独自に調達したGPUを使ってAIモデルの研究開発を進めたりしていましたが、そのままでは大規模化することが難しかったという背景があります。オンプレミスなシステムは安定運用、クラウドは機動力という特性がありますが、いずれにしても最新のGPUを用いてモデル開発を行い、フェーズに応じてGPUを増やして試行回数を増やしていくのが理想的な開発の進め方です。

JAMSTEC横浜研究所内に展示されている歴代の「地球シミュレータ」。左は2021年から稼働中の第4世代モデル「ES-4」、中央が第3世代「ES-3」、右が初代の「ES-1」となっている

──GENIACにはどのような経緯で参加されたのでしょう。

松岡:タイミング的に2026年度から始まるJAMSTECの第5期中長期計画の「目玉」になり得ることと、最新のクラウドGPUを活用することでオンプレミスのスパコンだけでは実施できない研究開発に着手しておきたいという思いがありました。短い準備期間でしたが、第2サイクルの応募に「地域気候サービスのための生成AI基盤モデルの開発」として計画書提出し、採択いただきました。

──開発されたモデルはどのようなものですか?

松岡:気候変動によるリスク評価や対策立案に特化した大規模言語モデル(LLM)を開発し、企業におけるTCFD(気候関連財務情報開示タスクフォース)レポート作成の効率化や、自治体における気候変動適応策の立案に役立てられることを目指しました。

その背景には、従来の気候変動対策の立案には、温暖化や地域経済に関する知見だけでなく、産業や文化など、実に多様な専門知識と人手が必要となる課題がありました。それに対して我々の特化型モデルは、専門知識が十分でない少数の担当者でも効率的に業務を進められるであろう点が大きなメリットです。例えば、将来気候予測データの活用からリスク推定、対策立案、評価、検証までを一気通貫で行えるようにしたいと考えています。

──モデルの規模や公開に関する方針を教えてください。

松岡:東京科学大学がLlama 3.3をベースに日本語能力を強化した70B規模のモデルSwallowに対して、気候変動関連の知識獲得やテーブルデータの読み込み、科学演算に特化した指示チューニングを行いました。目標としていた気候変動に特化した独自のベンチマーク指標で、ベースモデル比で20%の性能向上を達成しています。

精度の目標やモデルの規模は、GENIACによる助成と自己負担の比率から現実的なラインに設定しています。現在、研究成果を学術論文として投稿したところで、採択後にモデルやデータを公開する方針です。

──モデル構築にあたって最大の課題はどこにありましたか

松岡:やはり、学習データの品質です。半年という開発期間はデータのつくり込みという観点では必ずしも十分ではなく、本来であればデータの品質向上のために国内の専門家を広く巻き込みたいところでした。開発期間中は学習データの自動生成を基本に進め、一部のみ専門家監修を入れました。ここは今後強化すべきポイントです。

──GENIACに参加したことで得られた成果や新たに直面した課題はありますか。

松岡:最大の収穫は、民間の事業者、特にスタートアップの体制づくりとスピード感を間近で体験できたことです。一方で、私たち公的機関には人員や予算、意思決定のプロセスに制約があり、検証サイクルを十分に回しきれなかったという反省もあります。

マッチングイベントでも多くの民間企業とお会いする機会をつくっていただき、実際に興味をもっていただけましたが、期間中に事業化にまではつながりませんでした。学術研究がメインの機関として必ずしもビジネス化や社会実装に強いわけではなかったと言ってしまえば、それは言い訳になってしまいますが、確実に実用化に結び付けるという点は今後の最大の目標です。

──今後も特化型モデルの研究開発は継続していくのですよね?

松岡:実は、気候変動対策の立案は、JAMSTECというより国立研究開発法人国立環境研究所の中心的業務の一つとなっており、私自身も今年の9月から客員研究員として共同で研究開発を進めようとしています。体制としては、自治体とも連携しながらGENIACのプロジェクトを発展・強化する形になるはずです。

日本の研究プレゼンスとアーキテクチャの転換点

──AI分野を志す方へ伝えたいことは。

松岡:学術分野は民間と比較して人員や待遇面での厳しさがあり、人事採用も容易ではありません。しかし、中長期的な視点で社会課題に真正面から取り組める土壌があります。

JAMSTEC内にも、外部の研究者や技術者がサイエンスや社会課題解決に携われるクロスアポイントメント制度がありますので、フルタイムでなくても研究開発に関わっていただける方を歓迎しています。

──日本の気候変動対策の研究は、欧米諸国と比べて進んでいるのでしょうか?

松岡:各国に温暖化対策や地球環境に関連する研究機関がありますが、国際的にはそれらを取りまとめている「気候変動に関する政府間パネル(IPCC)」という枠組みがあります。

その中で日本は、地球シミュレータの存在もあり、気候変動のシミュレーション分野をけん引してきた実績があります。現在も海洋国家としての独自性から、一定のプレゼンスは発揮できていると思います。

──次世代の地球シミュレータでは、AIの活用も盛んになっていくのでしょうか。

松岡:地球シミュレータにGPUが入ってまだ1世代目なのですが、今後、CPUやベクトルプロセッサから高効率なGPUの活用へ重心が移っていく可能性は考えられます。私たちはそのような変化に合わせて、既存のシミュレーションのプログラムを大改修していく必要が生じるのかもしれません。

──JAMSTEC独自の観測データの意義をどのように捉えていますか。

松岡:現在のAI学習は既存データや合成データに依存しますが、深海探査など現場に行かなければ得られないデータがあります。例えば、海底洞窟のロボット探査で新種の生物を見つけるようなケースはインターネット上に存在しない情報であり、将来のAI開発にとって極めて貴重です。そのためには、「しんかい6500」のように老朽化した大型深海探査機の更新など、現場力の強化が重要だと考えています。

──今後、一般への情報提供や教育面ではどのような構想がありますか?

松岡:すでに提供を開始している海洋STEAM教育ライブラリの一環として、過去・現在・未来の地球環境について学べるチャットボットのようなツールを構想しています。

研究面では、気象・気候に限らず、海洋・生物・環境・地震などの特化型生成AIをエージェント化し、学際的に連携させたいです。さらにその延長で、国民が誰でも地球環境に関する個別のサービスを受けられる方向も模索していきます。

──最後に、公的機関がGENIACでの開発に挑む意義を改めて教えていただけますか。

松岡:学術的な研究成果を実社会の課題解決に結び付けようとするチャレンジに対して強力にサポートしていただけたという点で大きな意義がありました。当初想定していた用途に限らず、思いがけない方向へインパクトが広がる可能性があります。これから参加する際には、柔軟にフォーカスを動かし、連携の門戸を広く保つことが有益です。経済産業省とNEDOのプロジェクトでもありますので、スタートアップから大企業まで各分野をリードする事業者が集い、間近でお互いの経験に学びながら前進できるのが、GENIACの魅力だと実感しました。


GENIACトップへ

最終更新日:2025年12月25日