EPFL、生成動画のドリフト問題を解決... 数分長の安定した映像生成が可能に
生成動画の致命的な問題: ドリフト
現在の生成動画技術の最大の問題はドリフト(drift)だ。動画が数秒以上再生されるとシーケンスが非一貫的になり、品質が急激に低下する。これは既存のモデルが短期的なフレーム間の一貫性のみを維持し、長期的な安定性を保証しないためだ。
EPFLの革新的な解決策
スイス連邦工科大学ローザンヌ校(EPFL)の研究チームがこの問題を根本的に解決する動画生成手法を開発した。この手法はドリフトを本質的に除去し、追加の計算負担なしで数分長の安定した高品質動画を生成できる。
技術的差別点
既存の方法はドリフトを減らすためにより多くの計算リソースを投入する必要があったが、EPFLの方法は計算コストの増加なしに長期安定性を達成する。これはモデルアーキテクチャ自体を改善して時間的一貫性を維持する方式だ。
ICLR 2026で発表予定
この研究は2026年4月 ICLR(International Conference on Learning Representations) 2026で発表される予定だ。ICLRは機械学習およびAI分野で最も権威のある学会の一つだ。
産業への影響
この技術が商用化されれば、次のような分野に大きな影響を与えると予想される:
- 映画・アニメーション制作: 長尺の一貫したAI生成映像の活用
- 広告・マーケティング: 高品質動画コンテンツを迅速かつ低コストで制作
- 教育コンテンツ: 説明動画やシミュレーションの自動生成
- ゲーム産業: 手続き的に生成されるシネマティックとカットシーン
特にOpenAIのSora、GoogleのVeo、Runwayなど生成動画企業がこの研究に注目すると見られる。
Related Articles
Google DeepMindのシエラレオネ実験では、問題への取り組み方を尋ねるGeminiクエリが68%から90%へ増えた。8週間、12校、1,763人を対象にしたRCTで、教育AIの評価軸が行動変化へ移っている。
ByteDanceがAI動画生成モデルSeedance 2.0を公式リリース。Game Science CEOが「地球上最強の映像生成モデル」と評価し、実在人物映像への厳格な制限を導入した。
GoogleがI/O 2026(5月19日)で「世界モデル」Gemini Omniを発表した。Sora・Runwayなど既存のAI動画生成ツールと異なり、物理環境の因果関係を理解した上で自然言語の指示に応じてシーンを編集できる。VeoをGeminiアプリで置き換え、同日から提供開始となった。