Google I/O 2026: 会話でビデオを編集できる「世界モデル」Gemini Omni登場
「世界モデル」としての位置付け
GoogleはI/O 2026のキーノート(5月19日)でGemini Omniを発表した。DeepMind CEOのDemis Hassabis氏は、OmniをVeo・Nano Banana・Genieなどのメディア生成モデルと統合した「世界モデル(world model)」と説明した。Sora、Runway、従来のVeoのようにテキストプロンプトからクリップを生成するアプローチとは異なり、Omniは物理環境を理解し因果関係を予測した上で編集指示に応じる。
会話型動画編集がカギ
最大の特徴は会話型動画編集だ。「背景を夕日に変えて」「カメラを左に引いて」といった自然言語の指示を受けると、モデルがシーン全体のコンテキストを保持しながら変更を適用する。多くのAI動画モデルが編集後に人物や背景の一貫性を失う課題があるが、Gemini OmniはOmniがシーン全体のコンテキストを把握することでこれに対応している。
- マルチモーダル入力: テキスト・音声・画像・動画を同時処理
- 物理シミュレーション: スタイル変換ではなく環境理解に基づく編集
- シーン一貫性: 編集後も人物・背景・動きの整合性を維持
- YouTube統合: YouTube ShortsおよびYouTube Createアプリと今週連携開始(追加費用なし)
即日提供、Veoを置き換え
Gemini Omni Flashは発表当日からGoogle AI Plus・Pro・Ultraサブスクライバー向けにGeminiアプリとGoogle Flowで利用可能だ。GeminiアプリのVeoはGemini Omniに置き換えられる。OpenAI Sora、Runway、Klingが競合するAI動画市場において、Googleの「世界モデル」という位置付けは生成ではなく理解を重視した差別化戦略だ。
Related Articles
Google DeepMindは2026年5月12日、Gemini駆動のAIマウスポインター「Magic Pointer」を発表した。カーソル周辺の視覚・意味的コンテキストをリアルタイムで解析し、専用AIウィンドウを開かずに即座の支援を提供する。
Googleは5月12日「Android Show: I/O Edition」でGemini Intelligenceを発表。Galaxy S26とPixel 10を皮切りに夏から順次配信し、アプリ横断タスク自動化や自然言語ウィジェット生成機能が提供される。
GoogleがAndroid/ChromeOSを統合したOS上でGemini AIを核とする新ノートPCカテゴリー「Googlebook」を発表。Acer・ASUS・Dell・HP・Lenovoがデバイスを開発中で、2026年秋の発売を予定する。
Comments (0)
No comments yet. Be the first to comment!