DeepMindのAI共同臨床医、一次診療98問で97件クリティカルエラーなし
Original: Enabling a new model for healthcare with AI co-clinician View original →
医療AIの見出しは、しばしば医師を置き換えるかに寄りすぎる。Google DeepMindのAI共同臨床医研究が示したのは別の道筋だ。医師のふりをするモデルではなく、根拠検索、薬剤推論、遠隔診療の一部を支える厳しく監督された補助役としてAIを置く考え方である。この視点が重いのは、世界保健機関が2030年までに1000万人超の医療人材不足を見込んでいるからだ。医療現場は完全自律より先に、業務を支える増幅装置を必要としている。
最も強い結果は医師向け支援タスクで出た。DeepMindは現実的な一次診療クエリ98件でブラインド評価を行い、医師が既存の根拠統合ツールよりAI共同臨床医の回答を一貫して好んだとしている。さらに98件のうち97件でクリティカルエラーがなかったという。OpenFDA RxQA由来の難しい薬剤質問でも改善が大きかった。病院や一次診療ネットワークにとって、こうした数字は医療AIを単なるデモではなく、日常の調査支援候補として見直す材料になる。
同時に、限界もはっきり残った。DeepMindはGeminiとProject Astraを土台にしたライブ音声・動画機能で、20の合成遠隔診療シナリオと10人のphysician patient-actorを使った試験も実施した。総合では医師が上回り、とくにレッドフラッグの把握や重要な身体診察の誘導で差が出た。それでも140項目の評価のうち68項目では、AIが一次診療医と同等かそれ以上の水準を示したという。吸入器の使い方の修正や肩の動きの確認をその場で案内できた点も示された。
この進歩と抑制の同居が、この発表を追う価値そのものだ。DeepMindはこれを診断や治療の製品ではなく研究だと明言し、今後は米国、インド、オーストラリア、ニュージーランド、シンガポール、UAEの協力機関で評価を進めるとしている。もし次の段階でも結果が崩れなければ、医療AIの次章は診察を丸ごと置き換えるチャットボットではなく、医師が検索、想起、定型フォローアップに費やす時間を静かに削る臨床コパイロットに近づいていく。
Related Articles
Googleは2026年3月10日、Imperial College Londonと英国NHSとの研究で、experimental AI systemが従来screeningで見逃されていた interval cancer の25%を検出したと発表した。第2の研究では、AIをsecond readerとして使うとscreening workloadを推計40%削減できる可能性が示された。
火傷部位が21日以内に治癒しにくいかを約20〜25秒で示すAI医療機器が、米国で重要な規制ゲートを越えた。Spectral AIはDeepViewを火傷センター、外傷センター、救急部門向けに商業展開できる。
Google Researchは、皮膚症状を調べるAIを病名候補だけで測らず、利用者が次の行動を選べるかまで見た研究を示した。JAMA Dermatologyの2,345人調査と混合研究を合わせ、医療AI評価の焦点が利用者理解へ移っている。