Google, Gemini 3.1 Flash Live 공개... 저지연 voice agent와 Search Live 글로벌 확대

Google은 Mar 26, 2026에 Gemini 3.1 Flash Live를 공개하며, 실시간 voice interaction을 위한 최신 audio model을 본격 배치했다. 회사 설명에 따르면 이 모델은 더 낮은 latency와 더 정확한 tone understanding, 더 안정적인 turn-taking을 목표로 설계됐다. 단순히 demo용 음성 응답을 넘어서, developer가 실제 product에 넣을 수 있는 real-time dialogue stack으로 자리매김시키려는 움직임이다.

배포 범위도 넓다. Gemini 3.1 Flash Live는 preview 형태로 Gemini Live API에 들어가고, enterprise 고객은 Gemini Enterprise for Customer Experience에서 활용할 수 있다. 일반 사용자 측면에서는 Search Live와 Gemini Live에도 같은 계열의 향상이 반영된다. Google은 Search Live가 over 200 countries and territories로 확대되며, preferred language와 local context를 더 잘 반영한다고 설명했다.

성능 지표도 구체적으로 제시됐다. Google은 internal data에서 새로운 model이 Gemini 2.5 Flash보다 ComplexFuncBench Audio에서 90.8%, Audio MultiChallenge with thinking on에서 36.1%를 기록했다고 밝혔다. 회사는 tone과 speaking style을 더 잘 읽고, noisy environment나 accent variability에도 더 안정적으로 반응하도록 개선했다고 주장한다. 또 Gemini Live에서는 conversation length가 평균 두 배 가까이 길어졌고, interruption handling과 correction flow도 부드러워졌다고 설명했다.

신뢰성 장치도 함께 들어갔다. Google은 3.1 Flash Live로 생성된 모든 audio에 SynthID watermark를 적용해, AI-generated audio의 출처 추적 가능성을 높이겠다고 밝혔다. 실시간 음성 AI가 customer support, search, assistant workflow, mobile interaction으로 빠르게 확장되는 상황에서, watermarking을 제품 수준 기본값으로 넣는 것은 distribution 이후의 오용 가능성을 낮추려는 조치로 읽힌다.

이번 발표의 의미는 voice AI가 다시 별도 feature가 아니라 core interface로 취급되기 시작했다는 점이다. text chatbot 중심 경쟁에서 한 단계 나아가, low-latency speech, multilingual interaction, tool-connected dialogue를 묶어 서비스 품질을 겨루는 국면이다. 개발자 입장에서는 real-time voice agent 구축 비용이 더 낮아질 수 있고, enterprise 입장에서는 customer experience automation과 search experience 재설계가 동시에 빨라질 수 있다는 신호다.

Google, Gemini 3.1 Flash Live 공개... 저지연 voice agent와 Search Live 글로벌 확대

Related Articles

Google, Gemini 3.1 Flash Live 출시 확대… Gemini Live·Search Live·AI Studio 동시 전개

Gemini 3.6 Flash의 진짜 변화, 더 싼 agent 실행 비용

TPU가 tool 호출을 기다리지 않게… Google Tunix의 agentic RL 병목 제거

Related Articles

Google, Gemini 3.1 Flash Live 출시 확대… Gemini Live·Search Live·AI Studio 동시 전개
LLM X/Twitter Mar 30, 2026 2 min read

Gemini 3.6 Flash의 진짜 변화, 더 싼 agent 실행 비용
Google의 새 Gemini Flash 라인업에서 관심은 모델 이름보다 토큰 효율과 agent workflow 비용에 모였다. 3.6 Flash는 3.5 Flash보다 출력 토큰을 17% 줄였고, Cyber 모델은 CodeMender와 묶였다.

TPU가 tool 호출을 기다리지 않게… Google Tunix의 agentic RL 병목 제거