#realtime

LLM X/Twitter Mar 30, 2026 2 min read

Google, Gemini 3.1 Flash Live 출시 확대… Gemini Live·Search Live·AI Studio 동시 전개

Google DeepMind는 2026년 3월 26일 Gemini 3.1 Flash Live가 Gemini Live와 Google Search Live에 순차 적용되고, 개발자는 Google AI Studio에서 바로 사용할 수 있다고 밝혔다. Google은 이 모델을 자사 최고 품질의 audio model로 규정하며, 더 낮은 latency와 향상된 tonal understanding, 그리고 ComplexFuncBench Audio 90.8% 성능을 강조했다.

#google #gemini #voice-ai

LLM Mar 27, 2026 1 min read

Google, Gemini 3.1 Flash Live 공개... 저지연 voice agent와 Search Live 글로벌 확대

Google은 Mar 26, 2026에 Gemini 3.1 Flash Live를 발표하고 실시간 음성 상호작용 성능을 전면 강화했다. Gemini Live API, Gemini Enterprise for Customer Experience, Search Live, Gemini Live까지 같은 audio stack을 확장한 점이 핵심이다.

#google #gemini #voice-ai

AI Mar 15, 2026 2 min read

Mistral, Voxtral Realtime와 Voxtral Mini Transcribe V2로 speech stack 확장

Mistral은 Voxtral Realtime와 Voxtral Mini Transcribe V2를 공개하며 sub-200ms streaming transcription, 13개 언어 지원, realtime model의 open weights를 내놓았다. 동시에 Mistral Studio의 audio playground와 $0.003/min·$0.006/min pricing도 함께 제시했다.

#mistral #speech #transcription

AI X/Twitter Mar 14, 2026 1 min read

Together AI, 실시간 Voice Agent용 one-cloud stack 공개

Together AI는 March 12, 2026에 real-time voice agent용 one-cloud stack을 공개한다고 밝혔다. 공개 자료에는 under-500ms latency, 25+ region 확장, 그리고 voice-agent deployment에서 time-to-first-64-tokens를 77ms까지 낮춘 kernel 최적화 사례가 포함돼 있다.

#voice-agents #inference #realtime