ハーバード大研究がScienceに掲載:OpenAI o1、救急外来医師より高い診断精度を実証
研究概要
ハーバード医科大学とベス・イスラエル・ディアコネス医療センターの研究チームがScienceに発表した論文で、OpenAI o1モデルが実際の救急外来ケースの診断において2名の内科専門医を上回る精度を示した。
主な数値
- 実際の救急トリアージケース76件を評価
- OpenAI o1の正確または近似診断率: 67%
- 内科専門医2名: それぞれ55%と50%
- 5件の詳細臨床ケース: o1が89% vs 従来の検索ツールを使う医師46名: 34%
研究方法
モデルと医師の両方が、同一の未処理電子健康記録(EHR)データをテキスト形式のみで受け取った。追加の画像や検査データは提供されず、実際の臨床環境を再現した条件が整えられた。
意義と限界
研究チームは、AIが医師を代替するのではなく診断支援ツールとしての可能性を示したものだと強調した。76件というサンプルサイズは臨床導入の判断には不十分であり、追加研究が必要とされている。
出典: TechCrunch
Related Articles
Science誌に掲載された新研究によると、最先端のLLMは実際の救急室データと数百人の医師との比較実験において、診断選択・トリアージ・次のケア決定という主要な臨床タスクで人間の医師と同等またはそれを上回る成果を示した。研究者たちはAIが医師を代替するのではなく、協調ケアモデルへの統合を提言している。
OpenAIは、ChatGPTがscienceとmathematicsで既にresearch-scaleで使われていると述べた。2026年1月の報告書では、advanced science・math usageが週8.4 million messages、weekly userが約1.3 millionに達し、GPT-5.2がserious mathematical workでも初期成果を見せ始めたとしている。
HNはこの話を「AIがまた勝った」ではなく、人間が見落としていた道筋をモデルが指さした事例として受け取った。GPT-5.4 Proの粗い下書きを数学者が拾い上げて磨き直す流れこそが、スレッドの熱源だった。
Comments (0)
No comments yet. Be the first to comment!