ホーム
手術中における「外科医の判断」をAIが言語化して継承する。慶應義塾大学病院とディリーバ株式会社が挑む視覚・言語統合AIの開発―【共創事例vol.03】

手術中における「外科医の判断」をAIが言語化して継承する。慶應義塾大学病院とディリーバ株式会社が挑む視覚・言語統合AIの開発―【共創事例vol.03】

Use Case

2026/04/16

GENIACで採択される国産の生成AI研究開発は、企業や医療機関との協業・共創を通じて社会実装へと進み始めています。
慶應義塾大学病院とDireava（ディリーバ）株式会社は、外科手術の安全性向上と医学教育の質の向上を目指し、手術中の状況把握や意思決定を支える視覚・言語統合型AIの開発に取り組んでいます。外科医が何を見て、何を根拠に判断しているのか。その思考の手がかりを、手術中の画像情報と言語情報の両面からAIに学習させる試みです。外科医の抱える課題と開発の現状について、慶應義塾大学病院一般・消化器外科の川久保博文医師と、ディリーバ社CEOで、慶應義塾大学病院一般・消化器外科の竹内優志氏に話を伺いました。

＜プロフィール＞

川久保博文（かわくぼ・ひろふみ）
慶應義塾大学医学部外科学（一般・消化器）准教授。上部消化管外科（食道・胃）を専門とし、ロボット支援手術の日本内視鏡外科学会認定プロクターとして手術指導にも携わる。

竹内優志（たけうち・まさし）
Direava（ディリーバ）株式会社代表取締役 CEO。慶應義塾大学医学部発のスタートアップとして2023年に同社を設立。
慶應義塾大学病院一般・消化器外科に所属する現役の外科医として手術を執刀する傍ら、AIを用いた手術支援ソフトウェアの製品開発および販売を通じて、手術の安全性向上と合併症低減を目指す。

重要臓器に囲まれた領域で、慎重な判断を支える仕組みを

――外科医の立場から、長年感じてこられた現場課題を教えてください。

川久保：私は食道がんが専門で、食道の外科手術を多く手がけています。食道は胸部にあり、近くには肺や気管などがあります。さらに下方は心臓が近くにあり、心臓から出た大動脈が食道の周囲を走り、食道の背側に回り込む構造になっています。重要な臓器や血管に囲まれた部位ですので、手術中のわずかな認識のずれや操作の判断が、出血や気管損傷、重大な合併症などにつながる可能性があります。
そのため、現場では常に慎重な判断と技術が求められます。加えて、こうした判断や手技を医学生や若手医師、専攻医へ継承していくことにも難しさを感じています。

――医学教育の現場でも、AIが求められるようになったのでしょうか。

川久保：昔は「見て覚える」という教育の形もありました。しかし今はロボット手術や腹腔鏡手術の時代で、映像を見ながら「なぜその操作を選ぶのか」といった考え方まで言語化して伝える機会が増えています。知識や判断の背景を伝えるという意味で、AIが教育を補助する役割を担うことができれば、非常に有用だと考えています。
また、他院で手術を行う際に、慶應義塾大学病院の医師が直接赴いて指導を行うことがあります。そうした場面でも、教育の補助として何らかの支えがあれば望ましいと考えています。

――ディリーバと共同開発中のAIは「教育」と「判断支援」の両方を視野に入れているそうですね。

川久保：大学病院における業務として、学生教育が大変重要となります。医学生が「今何をしているのか」「この臓器は何か」といった基本的な疑問を持ったときに、状況に即して説明を補助できればより有用な教育につながります。専攻医への継承という意味でも、私たちの考え方を言語化して蓄積できれば、「こういうときはこう考える」という枠組みを伝えやすくなります。
さらに判断支援の観点では、経験豊富な医師同士でも、危険な局面や普段と異なる局面では手術中に相談することがあります。その際に、関連する情報や注意点を整理して提示できれば、意思決定を補助する仕組みになり得ます。
もちろん、最終的な判断と責任は医師にありますが、状況の見落としを減らすための補助として、AIを用いた注意喚起などは今後発展していく可能性があると思います。

「見るAI」から「考えるAI」へ。協働の出発点は現場の実感

――慶應義塾大学病院とディリーバが協働することになった経緯を教えてください。

川久保：もともと竹内は、私が責任者を務めている上部消化管班に所属していたので、上司と部下という関係で一緒に働いてきました。

竹内：川久保先生のチームの一員として研究開発を行なっておりました。2020年にフランス・ストラスブールにあるIRCADという外科教育・研究の拠点に留学し、現地チームとAIを使った外科ナビゲーションのプロジェクトを立ち上げました。
帰国後も、川久保先生のご指導の下で継続して進めることになったのが出発点です。最初から続けている取り組みは、手術中に重要な神経や構造物を認識する、いわば「見るAI」です。見誤りや見落としが起きやすい場面を、認識の面から補助することを目指しています。

――画像認識から、なぜ「ことば」を扱う生成AIの方向に進んだのでしょうか。

竹内：手術後に動画を見返してレポートを作成したり、指導の際に「この場面ではこう考える」と言語化して教えたりと、外科医の仕事では言語化が重要です。ただ、これまで医療領域でのAI活用は画像中心で、判断の背景にある言語情報は扱いにくい面がありました。
専門医が診断や手術中に考えていることを、言語情報としてAIに学ばせることができれば、教育の補助や情報整理の質が上がると考えたのがきっかけです。私はこれを「考えるAI」と呼んでいます。

――現状では、手術後のレポート作成や情報伝達はアナログな部分が残っているのでしょうか。

竹内：手術後のレポート作成は基本的に人的作業で、術後に記憶をたどって書いたり、録画動画を見返しながらまとめたりしています。医師の負担を軽くしたいというのも、今回のAI開発の動機の一つです。
現在GENIACで取り組んでいるプロジェクトの主目的は教育ですが、術中の質問に答える仕組みを応用すれば、術後のサマライズやレポート作成も同じ延長線上で実現できる可能性があります。

――医学生への教育効果はどのように検証されるのでしょうか。

竹内：学生の学習補助としては、すでに使える段階に近づいてきています。AIを使う前後で学生の理解がどれくらい変わるかも検証しており、短時間の学習でも理解が上がることを確認しています。GENIACの最終報告では、その成果についても発表したいと考えています。

視覚と言語を統合した基盤モデルの独自開発を目指す理由

――開発中の基盤モデルの概要と狙いをもう少し詳しく教えてください。

竹内：取り組みの中核となる外科手術に特化した基盤モデルは、術中画像も扱えるようにしたマルチモーダル型のモデルです。術式や解剖構造、術者の行動に関する知識を学習させることを狙っています。
そのために、外科専門の言語コーパスを収集し、術中画像と自然言語キャプションのデータセットを構築した上で、解剖部位のアノテーション、医学的評価と外部検証を進めます。最終的には、日本語と外科手術に特化した7B規模のマルチモーダル基盤モデルの開発を目指しています。

――GENIACの期間では、どのように開発のロードマップを描いていますか。

竹内：ファーストステップは手術教育、セカンドステップで手術支援につなげる、という整理で進めています。手術支援として提供する場合は医療機器としての承認が必要になるためです。
現状の精度としては学生に役立つレベルに到達しつつありますが、外科医が手術中の意思決定をAIに依存する段階までは様々な課題があります。そもそも生成AIを用いた医療機器は前例が少なく、制度面の整理も課題です。国のプロジェクトとして進められるGENIACは、その意味でもメリットが大きいと感じています。

――どのような術中画像を学習させているのでしょうか。

竹内：手術は術式によって違いが大きいです。私たちは胃の手術なら胃に特化、大腸の手術なら大腸に特化という形で、術式ごとに専用のモデルをつくるのが特徴です。現状は胃と胆嚢の手術に対応できるようになっています。

――術式を広げる見通しも立てているのですか。

竹内：胃のモデルをつくる過程で、どのデータをどのように活用するのか、パラメータの調整、アノテーションの進め方などを設計として整理できました。まず自分たちが確実に正しいと判断できる領域から始めましたが、基盤ができれば他臓器への応用は進めやすくなります。
一方で、食道や膵臓などは難易度が高く、正解が複数ある局面もあるため、どう教えるかは慎重に設計する必要があります。

――データやセキュリティの観点で、難しいことはありますか。

竹内：大前提として、手術動画は個人情報を含むため慎重に扱う必要があります。大学のレギュレーションも厳しく、倫理委員会で安全性や個人情報管理について議論を重ねながら進めています。したがって、個人情報を含むデータであっても病院内で完結し、外部に出ない形にすることが望ましいと考えています。

GENIACの計算資源と議論の場が医療領域の開発にもたらしたもの

――GENIACへの応募のきっかけと、参加して得たものを教えてください。

竹内：ちょうど「考えるAI」の開発を始めた時期にGENIACを知り、応募したのが直接のきっかけです。参加前は第1期、第2期の活動は詳しくわかっていませんでしたが、第3期以降は領域を広げて医療を含むユースケースを増やしたいという方針を聞き、ニーズが合致しました。
大規模言語モデル（LLM）の開発には大きな計算資源が必要で、強力な計算リソースを提供いただけた点が大きかったです。国のバックアップがあることは信頼性の面でも重要でした。また、様々な領域の方とディスカッションできたのも大きいです。例えば領域や分野が違っていても、人が十分にできていない部分をAIで補うという方向性は共通していて、技術面でも学びがありました。

――その一方で、医療ならではの難しさもありそうです。

竹内：倫理や法の観点を踏まえた運用の整備、誤情報の混入を防ぐための検討、データをどこまで公開できるかといった点など、技術以外の課題にもリソースやエネルギーが必要だと再認識しました。特に医療データのようにセンシティブな情報の取り扱いを前提に設計した独自の開発が求められる難しさがあります。

――今後、他の医療機関へ広げていくための条件は何でしょうか。

竹内：現場がどんな状況で困っていて、どう役に立てるかを検証する必要があります。
現在は慶應義塾大学病院を中心に複数の医療機関と共同研究を進め、データをお借りしながらニーズも集めています。今後の目標は中規模、小規模の病院との協働をさらに推進していくことです。

川久保：内科領域では画像診断支援などでAI活用が進んでいますが、手術動画はハードルが高い領域です。だからこそ、手術の現場に合った形で慎重に進める必要があります。社会実装に向けて、まず教育支援を起点にして、現場に受け入れられる形をつくっていければと思います。

竹内：今回のプロジェクトでは、モデルの構築がゴールではありません。将来的に臨床現場で使える水準を見据え、データ整備から評価までの手順を整理し、一部の開発ノウハウを公表する計画も立てています。そして、手術室での実証を通じて、医療AIの規制に即した安全性と信頼性の評価を進める方針です。

――最後に、生成AIや医療Techに関心のある学生やエンジニアへ、メッセージをお願いします。

竹内：私は外科医でありながら、AIの開発にも携わっています。医療は命を扱う仕事で緊張感もありますが、医療に役立つAIなどを用いたプロダクトをつくって人の役に立てる喜びは大きいと思います。ぜひ私たちの取組みに関心を持ってほしいです。

川久保：慶應義塾大学病院では、学生がAIを積極的に活用し、使い方を学ぶ取り組みをしています。自分のやりたいことをAIにサポートしてもらいながら達成する経験を積み、使い方を身につけてほしいです。実践的な経験を重ねることで、新たな発想も出てくると思います。

GENIACトップへ

最終更新日：2026年4月16日