Google、実外来でAMIEを検証 safety stopは0件

ベンチマークから実診療へ

Google ResearchとGoogle DeepMindは2026年3月11日、conversational diagnostic AIである AMIE のprospective real-world feasibility studyを公表した。研究はBeth Israel Deaconess Medical Centerとの協力で行われ、simulationで有望だった診断支援systemが、実際のambulatory primary careでも安全かつ有用に機能するかを確かめることが目的だった。

研究はpre-registered、IRB-approvedのsingle-center設計で進められた。100人の成人患者が受診前にAMIEとの対話を完了し、そのうち98人が実際に予定された診療を受けた。Googleによれば、4つの事前定義されたsafety criteriaに基づいて介入できるhuman AI supervisorを待機させていたが、study期間中にsafety stopは1件も発生しなかった。

結果が示すこと

Googleは、overall management planの質とdifferential diagnosisの質について、AMIEがprimary care physicianと概ね同等だったと報告している。一方でmanagement planのpracticalityとcost-effectivenessではphysicianが優れていた。これは、実診療では純粋な診断reasoningだけでなく、運用判断や資源配分も重要であることを示している。

AMIEのdifferential diagnosisは最終的なphysician diagnosisを90%の症例で含み、top-3 accuracyは75%だった。さらに患者のAI systemへの信頼は対話後に上昇し、follow-up時点でも高いままだったという。これはconversational diagnostic systemが、受診前の情報整理やdecision supportの段階で実用性を持つ可能性を示す。

試験規模: 100件の患者対話、98件の後続受診。
安全性: human AI supervisorによる介入は不要だった。
解釈: 一部の診断指標では同等でも、practicalityとcostでは医師が優位だった。

Google自身も過度な一般化は避けている。これはclinical efficacyを証明するcontrolled trialではなく、feasibility studyにすぎない。textベースでsingle-centerという制約もある。それでも、医療AI評価をsynthetic benchmarkからreal care settingへ移した点は大きい。medical AIにとって本当に難しいのは、現場で機能するかどうかだからだ。

Google、実外来でAMIEを検証 safety stopは0件

ベンチマークから実診療へ

結果が示すこと

Related Articles

Google、primary careのreal-world studyで conversational diagnostic AI「AMIE」の初期feasibilityを提示

FDA、AIで臨床試験期間を最大40%短縮——因果AIのパイロット開始

JAMA study、AI scribeがEHR timeを小幅に減らしweekly visit volumeをわずかに押し上げたと示す

Comments (0)

Leave a Comment

Related Articles

Google、primary careのreal-world studyで conversational diagnostic AI「AMIE」の初期feasibilityを提示
Sciences Mar 12, 2026 1 min read

FDA、AIで臨床試験期間を最大40%短縮——因果AIのパイロット開始
FDAがクラウドベースの因果AI（Causal AI）を活用し、医薬品・医療機器の臨床試験期間を20〜40%短縮する初のパイロットを開始した。FDA最高AI責任者は規制承認の迅速化にもつながると述べている。

JAMA study、AI scribeがEHR timeを小幅に減らしweekly visit volumeをわずかに押し上げたと示す
Sciences X/Twitter Apr 14, 2026 1 min read