腐食中
ハーバード大研究がScienceに掲載:OpenAI o1、救急外来医師より高い診断精度を実証
研究概要
ハーバード医科大学とベス・イスラエル・ディアコネス医療センターの研究チームがScienceに発表した論文で、OpenAI o1モデルが実際の救急外来ケースの診断において2名の内科専門医を上回る精度を示した。
主な数値
- 実際の救急トリアージケース76件を評価
- OpenAI o1の正確または近似診断率: 67%
- 内科専門医2名: それぞれ55%と50%
- 5件の詳細臨床ケース: o1が89% vs 従来の検索ツールを使う医師46名: 34%
研究方法
モデルと医師の両方が、同一の未処理電子健康記録(EHR)データをテキスト形式のみで受け取った。追加の画像や検査データは提供されず、実際の臨床環境を再現した条件が整えられた。
意義と限界
研究チームは、AIが医師を代替するのではなく診断支援ツールとしての可能性を示したものだと強調した。76件というサンプルサイズは臨床導入の判断には不十分であり、追加研究が必要とされている。
出典: TechCrunch
Related Articles
Sciences X/Twitter 1d ago 1 min read
生命科学向けAIの評価が、研究現場に近い課題へ寄ってきた。OpenAIは、バイオ・製薬分野の科学者173人と7つの研究ワークフローにまたがる750課題を作ったとしている。
Sciences 5d ago 1 min read
Google Researchは、皮膚症状を調べるAIを病名候補だけで測らず、利用者が次の行動を選べるかまで見た研究を示した。JAMA Dermatologyの2,345人調査と混合研究を合わせ、医療AI評価の焦点が利用者理解へ移っている。
Sciences X/Twitter 1d ago 1 min read
AI化学者の評価軸が、文章回答から実験結果へ移り始めた。OpenAIはGPT-5.4がMolecule.oneのMaria AIと専門ラボと組み、創薬反応の改善案を検証結果まで進めたとしている。