Google、Gemini 3.1 Flash Live公開 低遅延voice agentとSearch Liveを世界展開

Original: Gemini 3.1 Flash Live: Making audio AI more natural and reliable View original →

Read in other languages: 한국어English
LLM Mar 27, 2026 By Insights AI 1 min read Source

GoogleはMar 26, 2026、real-time dialogue向けの新audio modelであるGemini 3.1 Flash Liveを発表した。今回の焦点は、voice AIを単なる音声入力の付加機能ではなく、production向けのcore interfaceとして押し出した点にある。Googleは、latencyの低下、tone understandingの改善、より自然なturn-takingによって、会話のテンポと精度を引き上げたとしている。

展開先も幅広い。developerはGemini Live APIのpreviewとして利用でき、enterpriseはGemini Enterprise for Customer Experience経由で導入できる。consumer向けにはSearch LiveとGemini Liveへ同系統の改善が入る。Googleによれば、Search Liveはover 200 countries and territoriesへ拡大し、preferred languageやlocal contextへの適応も強化される。

性能面では、GoogleはComplexFuncBench Audioで90.8%、Audio MultiChallenge with thinking onで36.1%を示し、Gemini 2.5 Flashより高い水準だと説明した。加えて、toneやspeaking styleの理解、noisy environmentやaccent variationへの耐性も向上したという。Gemini Liveではconversation lengthが平均で約2倍になり、ユーザーが途中で割り込んだり修正したりする場面でも、より自然に流れを維持できるとする。

信頼性の面では、3.1 Flash Liveが生成するaudioすべてにSynthID watermarkを付与する点も重要だ。Googleはvoice AIをsearch、assistant、customer supportなど複数のsurfaceへ広げる一方で、AI-generated audioの出所追跡も同時に強化しようとしている。これは実運用を前提にしたreleaseであることを示す要素の一つだ。

今回の発表は、AI競争の主戦場がtext chatbotだけではなく、real-timeでmultilingualなvoice interactionへ広がっていることを改めて示した。developerにとってはvoice agent構築の実装負荷を下げる可能性があり、enterpriseにとってはcustomer experience automationやsearch体験の再設計を早める材料になる。音声が再びAI product戦略の中心へ戻ってきた、と見ることができる。

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.