EPFL、生成動画のドリフト問題を解決... 数分長の安定した映像生成が可能に
生成動画の致命的な問題: ドリフト
現在の生成動画技術の最大の問題はドリフト(drift)だ。動画が数秒以上再生されるとシーケンスが非一貫的になり、品質が急激に低下する。これは既存のモデルが短期的なフレーム間の一貫性のみを維持し、長期的な安定性を保証しないためだ。
EPFLの革新的な解決策
スイス連邦工科大学ローザンヌ校(EPFL)の研究チームがこの問題を根本的に解決する動画生成手法を開発した。この手法はドリフトを本質的に除去し、追加の計算負担なしで数分長の安定した高品質動画を生成できる。
技術的差別点
既存の方法はドリフトを減らすためにより多くの計算リソースを投入する必要があったが、EPFLの方法は計算コストの増加なしに長期安定性を達成する。これはモデルアーキテクチャ自体を改善して時間的一貫性を維持する方式だ。
ICLR 2026で発表予定
この研究は2026年4月 ICLR(International Conference on Learning Representations) 2026で発表される予定だ。ICLRは機械学習およびAI分野で最も権威のある学会の一つだ。
産業への影響
この技術が商用化されれば、次のような分野に大きな影響を与えると予想される:
- 映画・アニメーション制作: 長尺の一貫したAI生成映像の活用
- 広告・マーケティング: 高品質動画コンテンツを迅速かつ低コストで制作
- 教育コンテンツ: 説明動画やシミュレーションの自動生成
- ゲーム産業: 手続き的に生成されるシネマティックとカットシーン
特にOpenAIのSora、GoogleのVeo、Runwayなど生成動画企業がこの研究に注目すると見られる。
Related Articles
EPFL 연구진이 생성형 비디오의 드리프트 문제를 해결하는 "에러 재활용 재훈련" 기법을 개발했다. 이는 AI 비디오가 수 초 후 일관성을 잃는 근본 문제를 해결하며, 시간 제약 없는 비디오 생성의 길을 연다.
Google DeepMind의 Sierra Leone 교실 실험에서 학생들의 문제 접근 질문 비중이 68%에서 90%로 늘었다. 8주간 1,763명을 대상으로 한 RCT라는 점에서 교육용 AI 논의가 사용감이 아니라 행동 변화 지표로 이동했다.
ByteDance가 AI 동영상 생성 모델 Seedance 2.0을 공식 출시했다. Game Science CEO가 '지구상 최강 영상 생성 모델'로 평가했으며, 실제 인물 영상에 대한 엄격한 제한을 적용했다.