ハーバード研究：OpenAI o1が救急患者の67%を正確に診断、医師を上回る

臨床試験の概要

ハーバード医科大学の研究チームは、ボストンの救急病院でOpenAIのo1推論モデルと医師チームを対象に診断能力を比較する試験を実施した。76人の患者について、同一の電子カルテ（バイタルサイン、属性情報、看護師のトリアージメモ）を両者に提供し、診断結果を比較した。

AIの優位性は、情報が限られた状況での緊急判断で特に顕著だった。ある症例では、血栓患者への抗凝固剤が効かないと判断した医師たちに対し、AIは患者のループス既往歴から肺炎症が実際の原因であることを正確に特定した。

筆頭著者のArjun Manrai教授（ハーバード医科大学）は「AIが医師を代替するという意味ではない」と強調した。今回の研究はテキストベースのデータのみを対象としており、患者の外見や身体所見は評価されていない。

共著者のAdam Rodman医師はLLMを「数十年で最もインパクトのある技術の一つ」と称し、10年以内に医療が「医師・患者・AI」の三者モデルへと移行すると予測している。

米国では医師の約5人に1人がすでにAIを診断補助に活用している。英国でも医師の16%が毎日、15%が毎週AIを使用しており、主な用途は臨床判断の支援だ。最大の懸念はAIのエラーと法的責任とされている。

AI X/Twitter 6d ago 1 min read

GPT-Live搭載のChatGPT VoiceがEdu、Business、Enterpriseプランへ世界展開された。BusinessのVoice in Chatは5 credits/分、Work・Codex音声は約6 credits/分と案内されている。

AI 6d ago 1 min read

OpenAIは米国ChatGPT利用者の業務メッセージ80万件超を分析し、職務固有の利用の43.5%が別職種のタスクだったと示した。肩書きより先に、誰が何を担当するかが変わり始めている。

AI 1d ago 1 min read

OpenAIは7月31日、自社モデルが週10億人超のactive usersと200万超のbusinessesに届いたと示した。GPT-5.6 Lunaの80%値下げも重なり、競争軸はモデル名より「有用な仕事1件あたりの単価」へ移っている。