Google DeepMindは2026年3月26日、Gemini 3.1 Flash LiveをGemini LiveとGoogle Search Liveへ順次展開し、開発者はGoogle AI Studioから利用を始められると発表した。Googleはこれを自社最高品質のaudio modelと位置づけ、低latency、向上したtonal understanding、ComplexFuncBench Audio 90.8%を打ち出している。
#realtime
RSS FeedLLM X/Twitter Mar 30, 2026 1 min read
LLM Mar 27, 2026 1 min read
GoogleはMar 26, 2026にGemini 3.1 Flash Liveを発表し、real-time audio AIをdeveloper、enterprise、consumer productへ横断展開した。Gemini Live API、Gemini Enterprise for Customer Experience、Search Live、Gemini Liveが同じvoice stackで強化される。
AI Mar 15, 2026 1 min read
Mistralは Voxtral Realtime と Voxtral Mini Transcribe V2 を公開し、sub-200ms の streaming transcription、13言語対応、realtime model の open weights を打ち出した。あわせて Mistral Studio の audio playground と $0.003/min・$0.006/min の pricing も提示している。
AI X/Twitter Mar 14, 2026 1 min read
Together AIはMarch 12, 2026にreal-time voice agent向けone-cloud stackを公開すると発表した。公開資料にはunder-500ms latency、25+ regionでのscaling、そしてvoice-agent deploymentでtime-to-first-64-tokensを77msまで下げたkernel最適化の事例が含まれている。