モデル
汎用言語
マルチモーダル
その他
データセット
学習用データセット
評価用データセット
ABEJA-Qwen3-14B-Agentic-256k-v0.1
事業者名
株式会社ABEJA
用途
汎用的なエージェント利用のためのモデル。そのままエージェント用途で活用できるほか、用途に応じた追加学習によりさらなる特化も可能。
特徴
Alibaba社のQwen3-14Bをベースに継続事前学習及び強化学習を実施。コンテキスト長を元モデルの2倍の256kにしつつ、プランニングをしながらのマルチステップなTool-Useでの自律的なタスク遂行が可能
公開形態・ライセンス
OSS
公開リンク
https://huggingface.co/abeja/ABEJA-Qwen3-14B-Agentic-256k-v0.1
gpt-oss-20b-Ja-Fin-CPT
事業者名
株式会社野村総合研究所
用途
日本語金融ドメインのSFT(教師ありファインチューニング)のベースモデル。独自の金融データによる追加事前学習の出発点としても利用可能。
特徴
OpenAIのgpt-oss-20bをベースに、Common Crawlおよびその他公開ソースから構築した日本語金融コーパスで継続事前学習(CPT)を実施。ドメイン分類と品質フィルタリングを適用。AWS p5en.48xlarge(NVIDIA H200 GPU×8)で学習。質問応答や文書分析など直接利用できる形で使いたい場合は派生モデルのgpt-oss-20b-Ja-Fin-Thinkingを推奨。
公開形態・ライセンス
OSS(Apache 2.0)
公開リンク
gpt-oss-20b-Ja-Fin-Thinking
事業者名
株式会社野村総合研究所
用途
日本語での金融質問応答、金融文書の分析・要約、金融推論・計算タスク、マルチターンの金融アドバイザリー会話。
特徴
gpt-oss-20b-Ja-Fin-CPTをベースに、推論トレース付き合成指示データセット(約144万サンプル・約95億トークン)でSFTを実施した日本語金融ドメイン推論モデル。japanese-lm-fin-harnessベンチマークで公式指示チューニング済みモデル比+5.57ポイント(平均66.93→72.50)、pfmt-bench-fin-jaでも平均スコア7.883→8.209と向上。
公開形態・ライセンス
OSS(Apache 2.0)
公開リンク
Qwen3-14B-Ja-Fin-CPT
事業者名
株式会社野村総合研究所
用途
日本語金融ドメインのSFT(教師ありファインチューニング)のベースモデル。独自の金融データによる追加事前学習の出発点としても利用可能。
特徴
AlibabaのQwen3-14B-Baseをベースに、Common Crawlおよびその他公開ソースから構築した日本語金融コーパスで継続事前学習(CPT)を実施。ドメイン分類と品質フィルタリングを適用。AWS p5en.48xlarge(NVIDIA H200 GPU×8)で学習。質問応答や文書分析など直接利用できる形で使いたい場合は派生モデルのQwen3-14B-Ja-Fin-Thinkingを推奨。
公開形態・ライセンス
OSS(Apache 2.0)
公開リンク
Qwen3-14B-Ja-Fin-Thinking
事業者名
株式会社野村総合研究所
用途
日本語での金融質問応答、金融文書の分析・要約、金融推論・計算タスク、マルチターンの金融アドバイザリー会話。
特徴
Qwen3-14B-Ja-Fin-CPTをベースに、推論トレース付き合成指示データセット(約144万サンプル・約95億トークン)でSFTを実施した日本語金融ドメイン推論モデル。japanese-lm-fin-harnessベンチマークで公式モデル比+0.74ポイント(平均71.04→71.78)、pfmt-bench-fin-jaでは平均スコア8.104→8.455と向上。
公開形態・ライセンス
OSS(Apache 2.0)
公開リンク
Rakuten AI 3.0
事業者名
楽天グループ株式会社
用途
AIアプリケーションのベースモデルとして利用可能。日本語に強く、テキスト生成・執筆・コード生成・文書分析などで利用可能。
特徴
日本語・英語データを活用し、継続的な事前学習と事後学習を実施した約7,000億パラメータ規模の大規模言語モデル。日本語言語ベンチマーク(例:JamC-QA, M-IFEval, MATH-100, MMLU-ProXなど)において、gpt-4oを上回るスコアを記録。MoE(=Mixture of Experts)アーキテクチャを採用し、同規模のモデルと比較して低い計算コストを実現。
公開形態・ライセンス
オープンウェイト・Apache 2.0
公開リンク
AIdeaLab VideoMoE
事業者名
株式会社AIdeaLab
用途
動画生成分野においてSparse Mixture of Experts を世界で初めて実装した例としてモデルを分析するのに適しています。
特徴
Alibaba社のWan 2.1 1.3Bをアップサイクリングすることで、Mixture of Expertsを実現しているところ。
公開形態・ライセンス
Apache-2.0
公開リンク
KARAKURI VL 2 8B Thinking 2603
事業者名
カラクリ株式会社
用途
日本語Computer Using Agent特化モデル
特徴
Alibaba社のQwen/Qwen3-VL-8B-Thinkingをベースに、コンピュータ操作を含む日本語画像データを追加学習。日本語Computer useのいくつかの指標においてQwen 3 VL 32BやClaude Sonnet 4.5などにも匹敵する性能。
公開形態・ライセンス
Apache 2.0
公開リンク
https://huggingface.co/karakuri-ai/karakuri-vl-2-8b-thinking-2603
Ishigaki-IDS-8B
事業者名
ONESTRUCTION株式会社
用途
建設業の3次元設計データ(BIM)、とりわけIDS(BIM属性情報要件)を作成する用途を想定し最適化。
特徴
Alibaba社のQwen3-8BをベースにBIMデータの標準拠性を特に重視し、CPT, SFT, RLVRを実施。BIMの国際標準化団体が公開するツールをもとに独自に構築したIDS-Benchにおいて、フロンティアモデルであるGemini3.1-Pro-Preview、GPT-5.3-codex(medium)を上回るスコアを達成。
公開形態・ライセンス
CC-BY-4.0
公開リンク
自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-8B-VL」
事業者名
株式会社Preferred Networks
用途
ドローン/ロボット/自動車/監視カメラなどのエッジデバイス上で効率よく動作するVLMとして、自律稼働デバイスでの現場運用(工場での作業分析・工具認識/インフラ設備の異常検出など)を想定。
特徴
中核LLMにDPOでInstruction Tuning済みの PLaMo 2.1-8B を採用。VQAとVisual Groundingを基本性能として重視し、VQAベンチマーク JA-VG-VQA-500 とVisual Groundingベンチマーク Ref-L4(英語・日本語) において、同規模の強力なオープンモデル(Asagi-14B、Qwen2.5-VL-7B、Qwen3-VL-8B)を上回るスコアを達成。
公開形態・ライセンス
オープンモデル(モデルの重みを一般に公開)をPLaMo Community Licenseで公開
公開リンク
Qwen-3-VL-Ricoh-8B-20260227
事業者名
株式会社リコー
用途
日本語に最適化されたVision Language Model(VLM)。
特徴
強化学習による推論プロセスの導入で、複雑なドキュメントの読み間違いを低減。データの抽出に留まらず、読み取った数値に基づく計算や比較分析の精度が向上。<think></think>タグ内を含めて日本語化することで、解答に至るまでの根拠を明確化。
公開形態・ライセンス
OSS
公開リンク
Stockmark-DocReasoner-Qwen2.5-VL-32B
事業者名
ストックマーク株式会社
用途
企業特化モデルを作成するためのベースモデル。特定ドメイン特化前のモデルであり、図表等を含むビジネスドキュメント読解に最適化。本モデルに追加学習を行うことで、特定ドメインに精通した高精度モデルを構築可能。
特徴
Alibaba社のQwen2.5-VL-32B-Instructをベースに、図表・図面を含む複雑なビジネスドキュメントで学習。製造業ドキュメント読解で高い性能を発揮し、CoTにより推論過程の可視化にも対応。
公開形態・ライセンス
OSS(Hugging Face公開 / Apache-2.0)
公開リンク
https://huggingface.co/stockmark/Stockmark-DocReasoner-Qwen2.5-VL-32B
Stockmark-DocReasoner-Qwen2.5-VL-32B-FP8-dynamic
事業者名
ストックマーク株式会社
用途
Stockmark-DocReasoner-Qwen2.5-VL-32Bモデルの軽量版。特定ドメイン特化前のモデルであり、図表等を含むビジネスドキュメント読解に最適化。FP8量子化により、限られた計算資源環境でも高効率に運用可能。
特徴
Stockmark-DocReasoner-Qwen2.5-VL-32BをベースにFP8(dynamic)量子化を適用し、精度を維持しつつ、VRAM削減と高速化を実現。図表・図面を含む複雑なビジネスドキュメント読解に対応。
公開形態・ライセンス
OSS(Hugging Face公開 / Apache-2.0)
公開リンク
https://huggingface.co/stockmark/Stockmark-DocReasoner-Qwen2.5-VL-32B-FP8-dynamic
DriveTiTok S-640
事業者名
Turing株式会社
用途
運転映像を対象とした画像トークナイザ。連続フレーム間の差分情報を効率的に圧縮・トークン化することで、画像データ量を約1/100に削減する。自動運転向けフィジカル基盤モデルにおいて、映像をトークン表現へ変換するエンコーダーとして利用する。
特徴
画像圧縮トークナイザーTiTokをベースとし、東京都内で収集した走行映像を用いて追加学習を実施。デコード時には、過去画像からシードトークンを生成し、Self-Attentionを用いて現在フレームとの差分情報を抽出するとともに、過去フレーム由来のグローバル情報も取り込む設計としている。これにより、時系列情報を効率的に利用できる。
公開形態・ライセンス
Apache 2.0
公開リンク
nri-fin-reasoning
事業者名
株式会社野村総合研究所
データ形式・モダリティ
テキスト(JSON形式、チャット形式マルチターン会話)
概要
日本語金融ドメインに特化した、推論トレース付き大規模合成指示データセット。632,636サンプル(約63.5億トークン)で構成され、openai/gpt-oss-120bにより生成。自由回答・数学・文章作成・選択式の4タスクをカバーし、最大3ターンのマルチターン対話を含む。金融ドメイン135トピック・一般ドメイン20トピックを網羅。LLM-as-a-Judgeによる5観点の品質フィルタリング(全項目5/5のサンプルのみ採用)を実施済み。
公開形態・ライセンス
OSS(CC BY 4.0)
公開形態・ライセンス
RACER: Rationale-Aware Captioning of Edge-Case Driving Scenarios
事業者名
Turing株式会社
データ形式・モダリティ
テキスト・画像・アクション
概要
自動運転向けVLA/VLMの学習に利用するデータセットであり、特に危険・予測困難・判断が分かれる状況などのエッジケースにおける運転意図の理解や行動生成能力の向上を目的としている。エッジケースに該当する運転シーンに対して言語説明や判断理由を付与することで、周囲環境の認識だけでなく、状況に応じた運転判断の根拠を含めた意思決定能力の学習を可能にする。
公開形態・ライセンス
CC BY-NC-SA 4.0
url
abeja/OpenAI-MRCR-Translation-JPN
事業者名
株式会社ABEJA
概要
LLMのロングコンテキスト性能を評価するための日本語データセット
公開形態・ライセンス
評価用データセットをMITライセンスで、評価実行用のコードをApache2.0ライセンスで公開
URL
評価用データセット:https://huggingface.co/datasets/abeja/OpenAI-MRCR-Translation-JPN
OSWorld-JP v0.2
事業者名
カラクリ株式会社
データ形式・モダリティ
マルチモーダル
概要
Computer useのスタンダードベンチマークであるOSWorld-Verifiedを日本語環境にローカライズした評価セット
公開形態・ライセンス
評価用コードをApache Lisence 2.0で公開
URL
IDS-Bench
事業者名
ONESTRUCTION株式会社
データ形式・モダリティ
json形式(IFC2X3・IFC4・IFC4X3_ADD2の3サブセット、計300件からなり、`input_csv` と `output_ids` などの項目を含む)
概要
CSV-to-IDSタスク用の評価データセットで、LLMがIFCデータチェック用CSVから適切なIDSを生成できるかを評価する
公開形態・ライセンス
CC-BY-4.0
URL
Ja-Ref-L4
事業者名
株式会社Preferred Networks
データ形式・モダリティ
SONL形式(captions_ja.jsonl)の日本語キャプション+生成用スクリプト(Python)。画像は元データセット Ref-L4 側を利用する前提のため、モダリティとしては 画像+テキスト(参照表現理解/REC)。
概要
参照表現理解(REC)のベンチマーク Ref-L4 の英語キャプションを、日本語性能評価用に置き換えるための日本語翻訳データ。翻訳はPreferred Networksの PLaMo翻訳モデルで生成した、PFNによる非公式翻訳。
公開形態・ライセンス
GitHub公開(Public repository)。ライセンスは CC BY-NC 4.0。ただし、元の Ref-L4本体および画像はそれぞれのライセンスに従う。
URL
JDocQA-Reasoning
事業者名
株式会社リコー
概要
JDocQAに用いられているテスト画像のサブセットに対して新規に一問一答のQAを付け直すことによって作成した、1000問以上からなる独自のベンチマーク。図表の読み取り能力及びモデルの推論能力をより評価し易い構成。
公開形態・ライセンス
アノテーションと評価用コードをApache Lisence 2.0で公開
URL
https://huggingface.co/datasets/ricoh-ai/JDocQA-Reasoning (今後公開予定)
JA-Business-Doc-RQ-Bench
事業者名
ストックマーク株式会社
データ形式・モダリティ
テキスト・画像
概要
日本語の図・表・図面・ドキュメントを対象に、マルチステップ推論能力を評価するためのベンチマークデータセット。合成生成されたビジネス文書と、人手で作成されたVQAタスクにより構成され、比較・集計・計算など複数段階の推論を必要とする問題を収録。製造業を含むビジネスドメインの複雑な文書読解能力を定量評価可能。
公開形態・ライセンス
データセットをApache License 2.0で公開
URL
https://huggingface.co/datasets/stockmark/JA-Business-Doc-RQ-Bench
最終更新日:2026年5月28日