Skip to content

구글 I/O 2026: 대화 한 마디로 영상 편집하는 Gemini Omni 공개

Read in other languages: English日本語
AI May 20, 2026 By Insights AI 1 min read Source

단순 생성기가 아닌 '세계 모델'

구글이 5월 19일 Google I/O 2026 키노트에서 Gemini Omni를 공개했다. DeepMind CEO 데미스 허사비스는 Gemini Omni를 Veo, Nano Banana, Genie 등 미디어 생성 모델을 통합한 '세계 모델(world model)'이라고 소개했다. Sora, Runway, 기존 Veo가 텍스트 프롬프트에서 클립을 생성하는 방식인 데 반해, Gemini Omni는 물리 환경의 원인·결과를 이해하고 이를 기반으로 편집 지시에 반응한다.

대화형 편집의 구체적 기능

핵심 차별화는 대화형 영상 편집이다. '배경을 석양으로 바꿔줘', '카메라를 왼쪽으로 당겨줘'처럼 자연어로 요청하면, 모델이 씬 전체의 컨텍스트를 유지한 채 수정을 적용한다. 기존 AI 영상 모델들이 편집 후 인물·배경 일관성을 잃는 문제를 Omni는 씬 전체 맥락 보존으로 해결한다.

  • 멀티모달 입력: 텍스트·음성·이미지·영상 동시 처리
  • 물리 시뮬레이션: 스타일 전환이 아닌 환경 이해 기반 편집
  • 시퀀스 일관성: 수정 후에도 인물·배경·동작 일관성 유지
  • YouTube 연동: YouTube Shorts·YouTube Create 앱과 이번 주 무료 통합

즉시 사용 가능, Veo 완전 대체

Gemini Omni Flash는 발표 당일 Google AI Plus·Pro·Ultra 구독자에게 Gemini 앱과 Google Flow 플랫폼을 통해 제공됐다. Gemini 앱 내 Veo는 Gemini Omni로 대체되며, YouTube Shorts와 YouTube Create 앱 연동은 이번 주 추가 비용 없이 순차 출시된다. OpenAI Sora, Runway, Kling이 경쟁하는 AI 영상 시장에서 구글은 '세계 모델'이라는 포지셔닝으로 차별화를 시도한다.

출처: Google Blog — Introducing Gemini Omni

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment