Gemini 3.5 Live Translate、70言語超のリアルタイム音声翻訳へ拡大

リアルタイム音声翻訳は、単独アプリの機能から、開発者や会議ツールが呼び出すモデル基盤へ移りつつある。Google DeepMindは6月9日の投稿で、Gemini 3.5 Live Translateを「fast, cross-language communication」向けの最新音声モデルと位置づけた。

重要な数字は70以上の言語だ。Googleの関連説明では、このモデルは音声が流れている最中に翻訳し、話し手の調子、速度、ピッチを保つことを目指す。一般ユーザーはAndroidとiOSのGoogle Translate、開発者はGemini Live APIとGoogle AI Studioのpublic preview、企業はGoogle Meetのprivate previewから利用する形になる。

Google DeepMindの公式アカウントは、Geminiの研究、モデル更新、Google製品への組み込みを継続的に発信している。今回の投稿で重要なのは、デモではなく配布先の広さだ。文が終わるのを待って翻訳する方式から、会話中に追従する音声-音声モデルへ変われば、カスタマーサポート、遠隔会議、教育、旅行アプリの設計が変わる。

次に見るべき点は、Googleの紹介例ではなく実利用での遅延と品質だ。70以上の言語対応は大きいが、専門用語、背景雑音、同時発話、アクセント差で精度が落ちれば業務利用には制約が残る。開発者向けpreviewが始まったことで、今後はAPIの費用、遅延、言語ペア別の安定性が評価軸になる。

AI X/Twitter Jul 1, 2026 1 min read

Nano Banana 2 LiteとGemini Omni Flash、画像・動画編集をAPI運用へ

生成メディアモデルは、デモ機能から開発者ワークフローへ移りつつある。Google DeepMindはNano Banana 2 Liteを高速・低コストな画像生成編集モデルとして示し、Gemini Omni Flashで会話型動画編集も同じ流れに置いた。

#google-deepmind #gemini #image-generation

AI X/Twitter May 14, 2026 1 min read

Google DeepMind、50年来のマウスポインターをAIで再発明 — Magic Pointer公開

Google DeepMindが「Magic Pointer」を発表。1970年代から変わらなかったマウスカーソルをAIエージェントとして再発明し、画面の内容を理解して適切な操作を提案する新しいインターフェースパラダイムを示した。

#google-deepmind #gemini #magic-pointer

AI X/Twitter Mar 2, 2026 1 min read

Google DeepMind、ProレベルとFlash速度を兼ね備えた画像モデル「Nano Banana 2」を発表

Google DeepMindがGemini Flashベースの新画像生成・編集モデル「Nano Banana 2」（Gemini 3.1 Flash Image）をリリース。Proレベルの品質と超高速生成を兼ね備え、リリース直後に画像生成ベンチマーク1位を達成した。

#google-deepmind #gemini #image-generation

Related Articles

Nano Banana 2 LiteとGemini Omni Flash、画像・動画編集をAPI運用へ

Google DeepMind、50年来のマウスポインターをAIで再発明 — Magic Pointer公開

Google DeepMind、ProレベルとFlash速度を兼ね備えた画像モデル「Nano Banana 2」を発表