Google, Gemini 3.1 Flash Live 공개... 저지연 voice agent와 Search Live 글로벌 확대
Original: Gemini 3.1 Flash Live: Making audio AI more natural and reliable View original →
Google은 Mar 26, 2026에 Gemini 3.1 Flash Live를 공개하며, 실시간 voice interaction을 위한 최신 audio model을 본격 배치했다. 회사 설명에 따르면 이 모델은 더 낮은 latency와 더 정확한 tone understanding, 더 안정적인 turn-taking을 목표로 설계됐다. 단순히 demo용 음성 응답을 넘어서, developer가 실제 product에 넣을 수 있는 real-time dialogue stack으로 자리매김시키려는 움직임이다.
배포 범위도 넓다. Gemini 3.1 Flash Live는 preview 형태로 Gemini Live API에 들어가고, enterprise 고객은 Gemini Enterprise for Customer Experience에서 활용할 수 있다. 일반 사용자 측면에서는 Search Live와 Gemini Live에도 같은 계열의 향상이 반영된다. Google은 Search Live가 over 200 countries and territories로 확대되며, preferred language와 local context를 더 잘 반영한다고 설명했다.
성능 지표도 구체적으로 제시됐다. Google은 internal data에서 새로운 model이 Gemini 2.5 Flash보다 ComplexFuncBench Audio에서 90.8%, Audio MultiChallenge with thinking on에서 36.1%를 기록했다고 밝혔다. 회사는 tone과 speaking style을 더 잘 읽고, noisy environment나 accent variability에도 더 안정적으로 반응하도록 개선했다고 주장한다. 또 Gemini Live에서는 conversation length가 평균 두 배 가까이 길어졌고, interruption handling과 correction flow도 부드러워졌다고 설명했다.
신뢰성 장치도 함께 들어갔다. Google은 3.1 Flash Live로 생성된 모든 audio에 SynthID watermark를 적용해, AI-generated audio의 출처 추적 가능성을 높이겠다고 밝혔다. 실시간 음성 AI가 customer support, search, assistant workflow, mobile interaction으로 빠르게 확장되는 상황에서, watermarking을 제품 수준 기본값으로 넣는 것은 distribution 이후의 오용 가능성을 낮추려는 조치로 읽힌다.
이번 발표의 의미는 voice AI가 다시 별도 feature가 아니라 core interface로 취급되기 시작했다는 점이다. text chatbot 중심 경쟁에서 한 단계 나아가, low-latency speech, multilingual interaction, tool-connected dialogue를 묶어 서비스 품질을 겨루는 국면이다. 개발자 입장에서는 real-time voice agent 구축 비용이 더 낮아질 수 있고, enterprise 입장에서는 customer experience automation과 search experience 재설계가 동시에 빨라질 수 있다는 신호다.
Related Articles
Google DeepMind는 2026년 3월 26일 Gemini 3.1 Flash Live가 Gemini Live와 Google Search Live에 순차 적용되고, 개발자는 Google AI Studio에서 바로 사용할 수 있다고 밝혔다. Google은 이 모델을 자사 최고 품질의 audio model로 규정하며, 더 낮은 latency와 향상된 tonal understanding, 그리고 ComplexFuncBench Audio 90.8% 성능을 강조했다.
Google이 에이전트 워크플로우에 최적화된 Gemini 3.5 Flash를 출시했다. 타 프론티어 모델 대비 4배 빠른 출력 속도와 절반 이하의 비용을 제공하며 코딩·멀티모달·추론 벤치마크에서 최상위권을 기록했다.
Google I/O 2026의 핵심은 Gemini를 앱 안의 챗봇보다 넓은 실행 계층으로 밀어 올리는 흐름이다. Gemini 3.5 Flash는 API와 Antigravity, Search, Gemini app에 풀렸고, Gemini Omni는 video 생성과 편집을 전면에 세웠다.