Google, real-world clinical study로 conversational diagnostic AI AMIE의 초기 feasibility 제시

무엇이 공개됐나

Google Research와 Google DeepMind는 2026년 3월 11일 Beth Israel Deaconess Medical Center와 함께 진행한 prospective real-world clinical study 결과를 공개했다. 이번 연구는 conversational diagnostic AI인 AMIE를 ambulatory primary care 방문 전에 배치해, 환자가 secure text chat으로 증상과 병력을 입력하고 clinician이 진료 전에 transcript와 summary를 검토하도록 설계됐다. AMIE가 benchmark나 simulated patient 평가를 넘어 실제 care workflow 안에서 검증된 것은 이번 발표의 핵심이다.

실제 운영 방식

연구에는 new, non-emergency complaint로 예약한 성인 환자 100명이 참여했고, 이 중 98명이 예정된 진료를 실제로 받았다. 각 AMIE 대화는 physician supervisor가 live로 지켜보며 self-harm 위험, 심각한 distress, potential clinical harm, 환자의 종료 요청 등 4가지 safety criteria가 발생하면 즉시 중단할 수 있게 했다. Google은 전체 상호작용에서 safety stop이 한 번도 필요하지 않았다고 설명했다. 환자가 primary care provider를 만나기 전에 AMIE는 사전 문진 transcript와 summary를 생성했고, clinician은 이를 바탕으로 방문 준비를 시작할 수 있었다.

핵심 결과

Google에 따르면 blinded clinical evaluator들은 differential diagnosis 품질과 management plan의 appropriateness 및 safety 측면에서 AMIE와 primary care provider를 대체로 비슷하게 평가했다. 다만 practicality와 cost effectiveness에서는 clinician 쪽 점수가 더 높았다. Google은 또 AMIE가 최종 진단을 90% 사례에서 포함했고 top-3 accuracy는 75%였으며, diagnostic test로 확정된 subset에서도 strong performance가 유지됐다고 밝혔다. 환자들의 AI에 대한 태도는 상호작용 이후 더 긍정적으로 바뀌었고, 참여 clinician들은 pre-visit summary가 visit readiness를 높였다고 평가했다.

왜 중요한가

이번 발표는 medical AI가 synthetic scenario를 넘어 prospective human-subject evidence를 축적하기 시작했다는 점에서 의미가 있다. 동시에 Google도 이것이 single-center feasibility study이며 text-only interface, live physician oversight, controlled comparison 부재라는 한계를 가진다고 분명히 밝혔다. 따라서 이번 결과는 conversational diagnostic AI가 제한된 조건에서 safe하고 workable할 수 있음을 보여주는 초기 근거로 읽는 것이 타당하며, independent clinical deployment가 이미 준비됐다는 의미로 확대 해석할 단계는 아니다.

Google, real-world clinical study로 conversational diagnostic AI AMIE의 초기 feasibility 제시

무엇이 공개됐나

실제 운영 방식

핵심 결과

왜 중요한가

Related Articles

Google, 실제 외래 진료에서 AMIE 시험... safety stop 0건

CytoDiffusion: 백혈병 감지에서 인간 전문가를 넘어선 AI 혈액 분석 시스템

JAMA study, AI scribe가 EHR time을 소폭 줄이고 weekly visit volume을 약간 높였다고 제시

Comments (0)

Leave a Comment

Related Articles

Google, 실제 외래 진료에서 AMIE 시험... safety stop 0건
Sciences Mar 27, 2026 1 min read

CytoDiffusion: 백혈병 감지에서 인간 전문가를 넘어선 AI 혈액 분석 시스템
Sciences Feb 8, 2026 1 min read

JAMA study, AI scribe가 EHR time을 소폭 줄이고 weekly visit volume을 약간 높였다고 제시
Sciences sources.twitter Apr 14, 2026 1 min read