ハーバード研究:OpenAI o1が救急患者の67%を正確に診断、医師を上回る
Original: OpenAI's o1 correctly diagnosed 67% of ER patients vs. 50-55% by triage doctors View original →
臨床試験の概要
ハーバード医科大学の研究チームは、ボストンの救急病院でOpenAIのo1推論モデルと医師チームを対象に診断能力を比較する試験を実施した。76人の患者について、同一の電子カルテ(バイタルサイン、属性情報、看護師のトリアージメモ)を両者に提供し、診断結果を比較した。
主な数値
- 基本トリアージ情報:AI 67% vs 医師 50〜55%
- 詳細情報あり:AI 82% vs 医師 70〜79%
- 長期治療計画(5件の症例):AI 89% vs 医師 34%
AIの優位性は、情報が限られた状況での緊急判断で特に顕著だった。ある症例では、血栓患者への抗凝固剤が効かないと判断した医師たちに対し、AIは患者のループス既往歴から肺炎症が実際の原因であることを正確に特定した。
代替ではなく協働モデル
筆頭著者のArjun Manrai教授(ハーバード医科大学)は「AIが医師を代替するという意味ではない」と強調した。今回の研究はテキストベースのデータのみを対象としており、患者の外見や身体所見は評価されていない。
共著者のAdam Rodman医師はLLMを「数十年で最もインパクトのある技術の一つ」と称し、10年以内に医療が「医師・患者・AI」の三者モデルへと移行すると予測している。
導入は既に進行中
米国では医師の約5人に1人がすでにAIを診断補助に活用している。英国でも医師の16%が毎日、15%が毎週AIを使用しており、主な用途は臨床判断の支援だ。最大の懸念はAIのエラーと法的責任とされている。
Related Articles
OpenAIはサイバー競争の問いを「最強モデルは誰か」から「防御ツールを誰が広く届けるか」へずらそうとしている。2026年4月29日の計画は5本柱で整理され、要点は防御アクセスの拡大と高リスク配備の可視性確保にある。
米連邦向けAIは性能より先に調達とコンプライアンスで止まりやすい。OpenAIは2026年4月27日、FedRAMP 20x Moderateを取得し、ChatGPT EnterpriseとAPIを政府利用の本線に押し上げた。
OpenAIはこれでAzure以外のクラウドにも本格的に出られる。4月27日に公開された修正版契約では、Azure先行提供は維持しつつ、Microsoftのライセンス独占を外し、資金の流れも2030年と2032年の線で引き直した。
Comments (0)
No comments yet. Be the first to comment!