Google DeepMind、あらゆる入力から動画を生成するGemini Omniを発表

Gemini Omniとは

Google DeepMindは2026年5月19日、Google I/O 2026にてGemini Omniを発表した。テキスト・画像・音声・動画など、あらゆる入力から動画を生成するOmniファミリーの第一弾モデルだ。GeminiのインテリジェンスとGoogleのメディア生成システムを統合したこのモデルを、Googleは「世界理解、マルチモーダル性、編集における新たな飛躍」と説明している。

主な機能

Gemini Omni Flashは、写真1枚から複数の動画バリエーションを生成し、追加プロンプトで構図やスタイルを変換できる。重力・運動エネルギー・流体力学など物理的な力への理解が向上し、よりリアルな映像表現が可能になった。Flashクリップは最長10秒に制限され、生成された動画すべてにGoogleのSynthIDデジタル透かしが埋め込まれ、合成コンテンツの追跡が可能だ。

提供範囲と利用方法

Google AI Plus・Pro・UltraサブスクライバーはGeminiアプリとGoogle Flowから即日利用できる。18歳以上のユーザーはYouTube Shorts RemixとYouTube Createアプリで無料で動画を生成できる。開発者向けAPIは数週間以内に提供予定だ。

Google I/O 2026の文脈

Gemini OmniはGemini 3.5 FlashとパーソナルAIエージェントGemini Sparkとともに発表され、Google I/O 2026の目玉の一つとなった。スンダー・ピチャイCEOは基調講演で「我々は今、エージェント型Gemini時代に確実に入った」と宣言した。より高速・低コストのFlashを先行リリースするGoogleの戦略は、フロンティア技術の維持と大規模ユーザーへの普及を両立させる姿勢を示している。

Google DeepMind、あらゆる入力から動画を生成するGemini Omniを発表

Gemini Omniとは

主な機能

提供範囲と利用方法

Google I/O 2026の文脈

Related Articles

Google、NotebookLMのCinematic Video Overviewsを英語で展開開始

Google、画像生成・編集モデル「Nano Banana 2」を発表

Gemini Embedding 2 GA、5 modality検索を単一vector layerへ統合

Related Articles

Google、NotebookLMのCinematic Video Overviewsを英語で展開開始
AI X/Twitter Mar 8, 2026 1 min read

Google、画像生成・編集モデル「Nano Banana 2」を発表
AI X/Twitter Mar 5, 2026 1 min read

Gemini Embedding 2 GA、5 modality検索を単一vector layerへ統合
AI X/Twitter Apr 23, 2026 1 min read