Google、Gemini 3.1 Flash Live公開 低遅延voice agentとSearch Liveを世界展開
Original: Gemini 3.1 Flash Live: Making audio AI more natural and reliable View original →
GoogleはMar 26, 2026、real-time dialogue向けの新audio modelであるGemini 3.1 Flash Liveを発表した。今回の焦点は、voice AIを単なる音声入力の付加機能ではなく、production向けのcore interfaceとして押し出した点にある。Googleは、latencyの低下、tone understandingの改善、より自然なturn-takingによって、会話のテンポと精度を引き上げたとしている。
展開先も幅広い。developerはGemini Live APIのpreviewとして利用でき、enterpriseはGemini Enterprise for Customer Experience経由で導入できる。consumer向けにはSearch LiveとGemini Liveへ同系統の改善が入る。Googleによれば、Search Liveはover 200 countries and territoriesへ拡大し、preferred languageやlocal contextへの適応も強化される。
性能面では、GoogleはComplexFuncBench Audioで90.8%、Audio MultiChallenge with thinking onで36.1%を示し、Gemini 2.5 Flashより高い水準だと説明した。加えて、toneやspeaking styleの理解、noisy environmentやaccent variationへの耐性も向上したという。Gemini Liveではconversation lengthが平均で約2倍になり、ユーザーが途中で割り込んだり修正したりする場面でも、より自然に流れを維持できるとする。
信頼性の面では、3.1 Flash Liveが生成するaudioすべてにSynthID watermarkを付与する点も重要だ。Googleはvoice AIをsearch、assistant、customer supportなど複数のsurfaceへ広げる一方で、AI-generated audioの出所追跡も同時に強化しようとしている。これは実運用を前提にしたreleaseであることを示す要素の一つだ。
今回の発表は、AI競争の主戦場がtext chatbotだけではなく、real-timeでmultilingualなvoice interactionへ広がっていることを改めて示した。developerにとってはvoice agent構築の実装負荷を下げる可能性があり、enterpriseにとってはcustomer experience automationやsearch体験の再設計を早める材料になる。音声が再びAI product戦略の中心へ戻ってきた、と見ることができる。
Related Articles
GoogleはMar 03, 2026、Gemini 3.1 Flash-LiteをGemini 3 seriesで最も高速かつcost-efficientなmodelとして発表した。preview段階から低価格と高throughputを前面に出し、大量developer workloadを狙う。
Googleは2026年2月19日、Gemini 3.1 Proを公開し、Google AI Studio、Gemini CLI、Vertex AI、Gemini app、NotebookLMなどへの展開を開始した。ARC-AGI-2で77.1%を記録し、Gemini 3 Proのreasoning性能を2倍超に高めたとGoogleは説明している。
GoogleがGemini 3.1 Flash-Liteをpreviewで公開した。Gemini 3シリーズで最も高速かつ低コストのモデルと位置づけ、translationやmoderation、agent workloadの大規模運用を狙う。
Comments (0)
No comments yet. Be the first to comment!