ハーバード大研究がScienceに掲載：OpenAI o1、救急外来医師より高い診断精度を実証

研究概要

ハーバード医科大学とベス・イスラエル・ディアコネス医療センターの研究チームがScienceに発表した論文で、OpenAI o1モデルが実際の救急外来ケースの診断において2名の内科専門医を上回る精度を示した。

主な数値

実際の救急トリアージケース76件を評価
OpenAI o1の正確または近似診断率: 67%
内科専門医2名: それぞれ55%と50%
5件の詳細臨床ケース: o1が89% vs 従来の検索ツールを使う医師46名: 34%

研究方法

モデルと医師の両方が、同一の未処理電子健康記録（EHR）データをテキスト形式のみで受け取った。追加の画像や検査データは提供されず、実際の臨床環境を再現した条件が整えられた。

意義と限界

研究チームは、AIが医師を代替するのではなく診断支援ツールとしての可能性を示したものだと強調した。76件というサンプルサイズは臨床導入の判断には不十分であり、追加研究が必要とされている。

出典: TechCrunch

Sciences 2h ago 1 min read

Astraが数学・TCSの10難問で新結果、Lean証明も公開

OpenAIは未公開モデルAstraが数学・理論計算機科学の長年の未解決問題10件で新結果を出したと説明した。探索コストはSol API換算で約$2,000、各論証はLean certificateとして形式化された。

#openai #mathematics #lean

Sciences X/Twitter 1d ago 1 min read

Astra、10件の未解決問題をLean証明付き研究成果に変えた衝撃

OpenAIの次期モデルファミリーAstraが、benchmarkだけでなく研究成果そのもので示された。内部版は10件の未解決問題で新結果を出し、探索に必要なtokensはSol API換算で約$2,000と説明されている。

#openai #astra #lean

Sciences Apr 14, 2026 1 min read

OpenAI、ChatGPT が scientific collaborator になりつつあると報告

OpenAIは、ChatGPTがscienceとmathematicsで既にresearch-scaleで使われていると述べた。2026年1月の報告書では、advanced science・math usageが週8.4 million messages、weekly userが約1.3 millionに達し、GPT-5.2がserious mathematical workでも初期成果を見せ始めたとしている。

#openai #science #chatgpt