OpenAI Clinicians無料化、6,924会話検証とHealthBench Professional
Original: OpenAI health lead Karan Singhal pointed to ChatGPT for Clinicians and HealthBench Professional View original →
tweetが示したこと
OpenAIでhealth AIとsafetyに取り組むKaran Singhalは、launchを2つのbulletで説明した。ChatGPT for Clinicians, a free version of ChatGPT designed for clinical work; HealthBench Professional, a new benchmark to evaluate real clinician chat tasks.
彼のaccountは、health-AI research、model evaluation、OpenAI health product notesを投稿することが多い。このtweetが重要なのは、clinical AIで分けてはいけない2つの要素を同時に出している点だ。実ユーザー向けのproduct surfaceと、clinician-style tasksを評価するbenchmarkである。
OpenAI rolloutの文脈
OpenAIの記事によると、ChatGPT for Cliniciansはverified U.S. clinicians向けのfree versionで、physicians、nurse practitioners、physician assistants、pharmacistsを対象にする。会社はこれをautonomous diagnosisではなく、administrative and clinical-support workflows向けと位置づけている。この境界は重要だ。healthcare usersはdocumentation help、chart review、patient communication drafts、literature synthesisを求めるが、最終判断はliabilityとlocal policyに制約される。
記事には具体的なevaluation claimsもある。OpenAIはphysician advisorsが6,924 conversationsをreviewし、responsesを99.6% of the time safe and accurateと評価したと書く。さらに、real clinician chat tasksを評価するより難しいbenchmarkとしてHealthBench Professionalを示している。OpenAIはphysician AI useが前年48%から2024年72%へ上がったという数字も引用した。
次に見るべき点はadoptionだけではない。benchmarkがcliniciansの実際のedge casesを捉えるかが中心だ。ambiguous symptoms、medication interactions、incomplete charts、local protocolsへの適応がそこに含まれる。regulatorsやhospital systemsはaudit logs、data handling、patient-specific adviceの境界も見る。free productは速く広がるが、持続的なtrustはOpenAI内部reviewの外で再現されるsafety evidenceにかかっている。
Sources: X source tweet · linked source
Related Articles
個人向けAIの価値は1回の回答から、長く残る文脈管理へ移っている。OpenAIは米国のPlus・Proから新memoryを展開し、Free提供に必要な計算量を約5分の1にしたと説明した。
OpenAIは医療向けワークスペースを無料で広げた。医師のAI利用率が72%まで上がった局面で、認証済みの米国の医師、NP、PA、薬剤師に開放し、6,924件の会話評価では99.6%を安全かつ正確と示した。
OpenAIが5月15日、ChatGPT Proユーザー向けに個人資産管理機能のプレビューを公開した。Plaid経由で1万2000以上の金融機関と口座を連携し、支出分析・サブスクリプション管理・投資残高を会話形式で照会できる。送金や決済は一切できない読み取り専用サービスだ。