生成AI基盤モデル開発第3期成果物(モデル・データセット)公開（METI/経済産業省）

×

ABEJA-Qwen3-14B-Agentic-256k-v0.1

事業者名

株式会社ABEJA

用途

汎用的なエージェント利用のためのモデル。そのままエージェント用途で活用できるほか、用途に応じた追加学習によりさらなる特化も可能。

特徴

Alibaba社のQwen3-14Bをベースに継続事前学習及び強化学習を実施。コンテキスト長を元モデルの2倍の256kにしつつ、プランニングをしながらのマルチステップなTool-Useでの自律的なタスク遂行が可能

公開形態・ライセンス

OSS

公開リンク

https://huggingface.co/abeja/ABEJA-Qwen3-14B-Agentic-256k-v0.1

閉じる

×

gpt-oss-20b-Ja-Fin-CPT

事業者名

株式会社野村総合研究所

用途

日本語金融ドメインのSFT（教師ありファインチューニング）のベースモデル。独自の金融データによる追加事前学習の出発点としても利用可能。

特徴

OpenAIのgpt-oss-20bをベースに、Common Crawlおよびその他公開ソースから構築した日本語金融コーパスで継続事前学習（CPT）を実施。ドメイン分類と品質フィルタリングを適用。AWS p5en.48xlarge（NVIDIA H200 GPU×8）で学習。質問応答や文書分析など直接利用できる形で使いたい場合は派生モデルのgpt-oss-20b-Ja-Fin-Thinkingを推奨。

公開形態・ライセンス

OSS（Apache 2.0）

公開リンク

https://huggingface.co/nri-ai/gpt-oss-20b-Ja-Fin-CPT

閉じる

×

gpt-oss-20b-Ja-Fin-Thinking

事業者名

株式会社野村総合研究所

用途

日本語での金融質問応答、金融文書の分析・要約、金融推論・計算タスク、マルチターンの金融アドバイザリー会話。

特徴

gpt-oss-20b-Ja-Fin-CPTをベースに、推論トレース付き合成指示データセット（約144万サンプル・約95億トークン）でSFTを実施した日本語金融ドメイン推論モデル。japanese-lm-fin-harnessベンチマークで公式指示チューニング済みモデル比+5.57ポイント（平均66.93→72.50）、pfmt-bench-fin-jaでも平均スコア7.883→8.209と向上。

公開形態・ライセンス

OSS（Apache 2.0）

公開リンク

https://huggingface.co/nri-ai/gpt-oss-20b-Ja-Fin-Thinking

閉じる

×

Qwen3-14B-Ja-Fin-CPT

事業者名

株式会社野村総合研究所

用途

日本語金融ドメインのSFT（教師ありファインチューニング）のベースモデル。独自の金融データによる追加事前学習の出発点としても利用可能。

特徴

AlibabaのQwen3-14B-Baseをベースに、Common Crawlおよびその他公開ソースから構築した日本語金融コーパスで継続事前学習（CPT）を実施。ドメイン分類と品質フィルタリングを適用。AWS p5en.48xlarge（NVIDIA H200 GPU×8）で学習。質問応答や文書分析など直接利用できる形で使いたい場合は派生モデルのQwen3-14B-Ja-Fin-Thinkingを推奨。

公開形態・ライセンス

OSS（Apache 2.0）

公開リンク

https://huggingface.co/nri-ai/Qwen3-14B-Ja-Fin-CPT

閉じる

×

Qwen3-14B-Ja-Fin-Thinking

事業者名

株式会社野村総合研究所

用途

日本語での金融質問応答、金融文書の分析・要約、金融推論・計算タスク、マルチターンの金融アドバイザリー会話。

特徴

Qwen3-14B-Ja-Fin-CPTをベースに、推論トレース付き合成指示データセット（約144万サンプル・約95億トークン）でSFTを実施した日本語金融ドメイン推論モデル。japanese-lm-fin-harnessベンチマークで公式モデル比+0.74ポイント（平均71.04→71.78）、pfmt-bench-fin-jaでは平均スコア8.104→8.455と向上。

公開形態・ライセンス

OSS（Apache 2.0）

公開リンク

https://huggingface.co/nri-ai/Qwen3-14B-Ja-Fin-Thinking

閉じる

×

Rakuten AI 3.0

事業者名

楽天グループ株式会社

用途

AIアプリケーションのベースモデルとして利用可能。日本語に強く、テキスト生成・執筆・コード生成・文書分析などで利用可能。

特徴

日本語・英語データを活用し、継続的な事前学習と事後学習を実施した約7,000億パラメータ規模の大規模言語モデル。日本語言語ベンチマーク（例：JamC-QA, M-IFEval, MATH-100, MMLU-ProXなど）において、gpt-4oを上回るスコアを記録。MoE（=Mixture of Experts）アーキテクチャを採用し、同規模のモデルと比較して低い計算コストを実現。

公開形態・ライセンス

オープンウェイト・Apache 2.0

公開リンク

https://huggingface.co/Rakuten/RakutenAI-3.0

閉じる

×

AIdeaLab VideoMoE

事業者名

株式会社AIdeaLab

用途

動画生成分野においてSparse Mixture of Experts を世界で初めて実装した例としてモデルを分析するのに適しています。

特徴

Alibaba社のWan 2.1 1.3Bをアップサイクリングすることで、Mixture of Expertsを実現しているところ。

公開形態・ライセンス

Apache-2.0

公開リンク

https://huggingface.co/aidealab/AIdeaLab-VideoMoE-7B-A2B

閉じる

×

Buddymodel

事業者名

AI inside 株式会社

用途

様々なシチュエーションに迅速に適応し、会話のみでPC上の多様な業務を実行する「相棒」モデルの実現および知見の蓄積

特徴

画像理解・聴きながら話す（全二重対話）能力・人間に寄りそう能力を備えた小型マルチモーダルモデル

公開形態・ライセンス

非公開。知見をプロダクトに組み込むことでの社会への価値還元を目指す

閉じる

×

KARAKURI VL 2 8B Thinking 2603

事業者名

カラクリ株式会社

用途

日本語Computer Using Agent特化モデル

特徴

Alibaba社のQwen/Qwen3-VL-8B-Thinkingをベースに、コンピュータ操作を含む日本語画像データを追加学習。日本語Computer useのいくつかの指標においてQwen 3 VL 32BやClaude Sonnet 4.5などにも匹敵する性能。

公開形態・ライセンス

Apache 2.0

公開リンク

https://huggingface.co/karakuri-ai/karakuri-vl-2-8b-thinking-2603

閉じる

×

Ishigaki-IDS-8B

事業者名

ONESTRUCTION株式会社

用途

建設業の3次元設計データ（BIM）、とりわけIDS（BIM属性情報要件）を作成する用途を想定し最適化。

特徴

Alibaba社のQwen3-8BをベースにBIMデータの標準拠性を特に重視し、CPT, SFT, RLVRを実施。BIMの国際標準化団体が公開するツールをもとに独自に構築したIDS-Benchにおいて、フロンティアモデルであるGemini3.1-Pro-Preview、GPT-5.3-codex（medium）を上回るスコアを達成。

公開形態・ライセンス

CC-BY-4.0

公開リンク

https://huggingface.co/ONESTRUCTION/Ishigaki-IDS-8B

閉じる

×

自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-8B-VL」

事業者名

株式会社Preferred Networks

用途

ドローン／ロボット／自動車／監視カメラなどのエッジデバイス上で効率よく動作するVLMとして、自律稼働デバイスでの現場運用（工場での作業分析・工具認識／インフラ設備の異常検出など）を想定。

特徴

中核LLMにDPOでInstruction Tuning済みの PLaMo 2.1-8B を採用。VQAとVisual Groundingを基本性能として重視し、VQAベンチマーク JA-VG-VQA-500 とVisual Groundingベンチマーク Ref-L4（英語・日本語）において、同規模の強力なオープンモデル（Asagi-14B、Qwen2.5-VL-7B、Qwen3-VL-8B）を上回るスコアを達成。

公開形態・ライセンス

オープンモデル（モデルの重みを一般に公開）をPLaMo Community Licenseで公開

公開リンク

https://huggingface.co/collections/pfnet/plamo-2-vl

閉じる

×

Qwen-3-VL-Ricoh-8B-20260227

事業者名

株式会社リコー

用途

日本語に最適化されたVision Language Model(VLM)。

特徴

強化学習による推論プロセスの導入で、複雑なドキュメントの読み間違いを低減。データの抽出に留まらず、読み取った数値に基づく計算や比較分析の精度が向上。<think></think>タグ内を含めて日本語化することで、解答に至るまでの根拠を明確化。

公開形態・ライセンス

OSS

公開リンク

https://huggingface.co/ricoh-ai/Qwen-3-VL-Ricoh-8B-20260227

閉じる

×

Stockmark-DocReasoner-Qwen2.5-VL-32B

事業者名

ストックマーク株式会社

用途

企業特化モデルを作成するためのベースモデル。特定ドメイン特化前のモデルであり、図表等を含むビジネスドキュメント読解に最適化。本モデルに追加学習を行うことで、特定ドメインに精通した高精度モデルを構築可能。

特徴

Alibaba社のQwen2.5-VL-32B-Instructをベースに、図表・図面を含む複雑なビジネスドキュメントで学習。製造業ドキュメント読解で高い性能を発揮し、CoTにより推論過程の可視化にも対応。

公開形態・ライセンス

OSS（Hugging Face公開 / Apache-2.0）

公開リンク

https://huggingface.co/stockmark/Stockmark-DocReasoner-Qwen2.5-VL-32B

閉じる

×

Stockmark-DocReasoner-Qwen2.5-VL-32B-FP8-dynamic

事業者名

ストックマーク株式会社

用途

Stockmark-DocReasoner-Qwen2.5-VL-32Bモデルの軽量版。特定ドメイン特化前のモデルであり、図表等を含むビジネスドキュメント読解に最適化。FP8量子化により、限られた計算資源環境でも高効率に運用可能。

特徴

Stockmark-DocReasoner-Qwen2.5-VL-32BをベースにFP8（dynamic）量子化を適用し、精度を維持しつつ、VRAM削減と高速化を実現。図表・図面を含む複雑なビジネスドキュメント読解に対応。

公開形態・ライセンス

OSS（Hugging Face公開 / Apache-2.0）

公開リンク

https://huggingface.co/stockmark/Stockmark-DocReasoner-Qwen2.5-VL-32B-FP8-dynamic

閉じる

×

DriveHeron-2B

事業者名

Turing株式会社

用途

自動運転特化のVLA (Vision-Language-Action) モデル。フロントカメラ画像と車両キネマティクスを入力とし、将来の走行軌跡を出力する。車載システムと結合することで、リアルタイムでの制御が可能。

特徴

VLMバックボーンに、将来軌跡を連続値として出力する回帰型アクションヘッドを組み合わせた構成としている。東京都内で収集した1,500時間超の走行データを用いて学習を行い、基本的な走行性能を実現。

公開形態・ライセンス

公開なし

閉じる

×

DriveTiTok S-640

事業者名

Turing株式会社

用途

運転映像を対象とした画像トークナイザ。連続フレーム間の差分情報を効率的に圧縮・トークン化することで、画像データ量を約1/100に削減する。自動運転向けフィジカル基盤モデルにおいて、映像をトークン表現へ変換するエンコーダーとして利用する。

特徴

画像圧縮トークナイザーTiTokをベースとし、東京都内で収集した走行映像を用いて追加学習を実施。デコード時には、過去画像からシードトークンを生成し、Self-Attentionを用いて現在フレームとの差分情報を抽出するとともに、過去フレーム由来のグローバル情報も取り込む設計としている。これにより、時系列情報を効率的に利用できる。

公開形態・ライセンス

Apache 2.0

公開リンク

https://huggingface.co/turing-motors/drive_titok_s_640

閉じる

×

低分子生成モデル

事業者名

SyntheticGestalt株式会社

用途

ヒット化合物のデザイン

特徴

任意の標的ポケットに対して、相互作用を設定しながら多様な新規化合物を生成できます

公開形態・ライセンス

共同研究プロジェクトにて、ご利用可能となります

閉じる

×

nri-fin-reasoning

事業者名

株式会社野村総合研究所

データ形式・モダリティ

テキスト（JSON形式、チャット形式マルチターン会話）

概要

日本語金融ドメインに特化した、推論トレース付き大規模合成指示データセット。632,636サンプル（約63.5億トークン）で構成され、openai/gpt-oss-120bにより生成。自由回答・数学・文章作成・選択式の4タスクをカバーし、最大3ターンのマルチターン対話を含む。金融ドメイン135トピック・一般ドメイン20トピックを網羅。LLM-as-a-Judgeによる5観点の品質フィルタリング（全項目5/5のサンプルのみ採用）を実施済み。

公開形態・ライセンス

OSS（CC BY 4.0）

公開形態・ライセンス

https://huggingface.co/datasets/nri-ai/nri-fin-reasoning

閉じる

×

高品質2者間音声対話データ

事業者名

AI inside 株式会社

データ形式・モダリティ

音声とそのアノテーションデータ）

概要

AIと人の自然な対話実現に向けた数百時間に及ぶ「聞き手」と「話し手」の高品質音声対話データ

公開形態・ライセンス

非公開　上記プロダクトへの知見組み込みを通して社会への価値還元を目指す

閉じる

×

RACER: Rationale-Aware Captioning of Edge-Case Driving Scenarios

事業者名

Turing株式会社

データ形式・モダリティ

テキスト・画像・アクション

概要

自動運転向けVLA/VLMの学習に利用するデータセットであり、特に危険・予測困難・判断が分かれる状況などのエッジケースにおける運転意図の理解や行動生成能力の向上を目的としている。エッジケースに該当する運転シーンに対して言語説明や判断理由を付与することで、周囲環境の認識だけでなく、状況に応じた運転判断の根拠を含めた意思決定能力の学習を可能にする。

公開形態・ライセンス

CC BY-NC-SA 4.0

url

https://huggingface.co/datasets/turing-motors/RACER-Mini

閉じる

×

abeja/OpenAI-MRCR-Translation-JPN

事業者名

株式会社ABEJA

概要

LLMのロングコンテキスト性能を評価するための日本語データセット

公開形態・ライセンス

評価用データセットをMITライセンスで、評価実行用のコードをApache2.0ライセンスで公開

URL

評価用データセット:https://huggingface.co/datasets/abeja/OpenAI-MRCR-Translation-JPN

実行用コード:https://github.com/abeja-inc/longcontext-evaluation

閉じる

×

buddyevalに用いるデータ

事業者名

AI inside 株式会社

データ形式・モダリティ

現時点ではテキストベースのデータ

概要

A対話から、buddymodelの「相棒」としての能力の評価に利用

公開形態・ライセンス

現時点では非公開。プロダクト上での能力向上による社会への価値還元を目指す

閉じる

×

OSWorld-JP v0.2

事業者名

カラクリ株式会社

データ形式・モダリティ

マルチモーダル

概要

Computer useのスタンダードベンチマークであるOSWorld-Verifiedを日本語環境にローカライズした評価セット

公開形態・ライセンス

評価用コードをApache Lisence 2.0で公開

URL

https://github.com/karakuri-ai/OSWorld-JP

閉じる

×

IDS-Bench

事業者名

ONESTRUCTION株式会社

データ形式・モダリティ

json形式（IFC2X3・IFC4・IFC4X3_ADD2の3サブセット、計300件からなり、`input_csv` と `output_ids` などの項目を含む）

概要

CSV-to-IDSタスク用の評価データセットで、LLMがIFCデータチェック用CSVから適切なIDSを生成できるかを評価する

公開形態・ライセンス

CC-BY-4.0

URL

https://huggingface.co/datasets/ONESTRUCTION/IDS-Bench

閉じる

×

Ja-Ref-L4

事業者名

株式会社Preferred Networks

データ形式・モダリティ

SONL形式（captions_ja.jsonl）の日本語キャプション＋生成用スクリプト（Python）。画像は元データセット Ref-L4 側を利用する前提のため、モダリティとしては画像＋テキスト（参照表現理解/REC）。

概要

参照表現理解（REC）のベンチマーク Ref-L4 の英語キャプションを、日本語性能評価用に置き換えるための日本語翻訳データ。翻訳はPreferred Networksの PLaMo翻訳モデルで生成した、PFNによる非公式翻訳。

公開形態・ライセンス

GitHub公開（Public repository）。ライセンスは CC BY-NC 4.0。ただし、元の Ref-L4本体および画像はそれぞれのライセンスに従う。

URL

https://github.com/pfnet-research/Ja-Ref-L4

閉じる

×

JDocQA-Reasoning

事業者名

株式会社リコー

概要

JDocQAに用いられているテスト画像のサブセットに対して新規に一問一答のQAを付け直すことによって作成した、1000問以上からなる独自のベンチマーク。図表の読み取り能力及びモデルの推論能力をより評価し易い構成。

公開形態・ライセンス

アノテーションと評価用コードをApache Lisence 2.0で公開

URL

https://huggingface.co/datasets/ricoh-ai/JDocQA-Reasoning （今後公開予定）

閉じる

×

JA-Business-Doc-RQ-Bench

事業者名

ストックマーク株式会社

データ形式・モダリティ

テキスト・画像

概要

日本語の図・表・図面・ドキュメントを対象に、マルチステップ推論能力を評価するためのベンチマークデータセット。合成生成されたビジネス文書と、人手で作成されたVQAタスクにより構成され、比較・集計・計算など複数段階の推論を必要とする問題を収録。製造業を含むビジネスドメインの複雑な文書読解能力を定量評価可能。

公開形態・ライセンス

データセットをApache License 2.0で公開

URL

https://huggingface.co/datasets/stockmark/JA-Business-Doc-RQ-Bench

閉じる

生成AI基盤モデル開発第3期成果物(モデル・データセット)公開

モデル

汎用言語

マルチモーダル

その他

データセット

学習用データセット

評価用データセット

生成AI基盤モデル開発 第3期 成果物(モデル・データセット)公開

モデル

汎用言語

マルチモーダル

その他

データセット

学習用データセット

評価用データセット

ABEJA-Qwen3-14B-Agentic-256k-v0.1

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

gpt-oss-20b-Ja-Fin-CPT

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

gpt-oss-20b-Ja-Fin-Thinking

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

Qwen3-14B-Ja-Fin-CPT

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

Qwen3-14B-Ja-Fin-Thinking

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

Rakuten AI 3.0​

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

AIdeaLab VideoMoE

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

Buddymodel

事業者名

用途

特徴

公開形態・ライセンス

KARAKURI VL 2 8B Thinking 2603

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

Ishigaki-IDS-8B

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-8B-VL」

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

Qwen-3-VL-Ricoh-8B-20260227

事業者名

用途

特徴

公開形態・ライセンス

公開リンク

Stockmark-DocReasoner-Qwen2.5-VL-32B

生成AI基盤モデル開発第3期成果物(モデル・データセット)公開

Rakuten AI 3.0