구글 I/O 2026: 대화 한 마디로 영상 편집하는 Gemini Omni 공개
단순 생성기가 아닌 '세계 모델'
구글이 5월 19일 Google I/O 2026 키노트에서 Gemini Omni를 공개했다. DeepMind CEO 데미스 허사비스는 Gemini Omni를 Veo, Nano Banana, Genie 등 미디어 생성 모델을 통합한 '세계 모델(world model)'이라고 소개했다. Sora, Runway, 기존 Veo가 텍스트 프롬프트에서 클립을 생성하는 방식인 데 반해, Gemini Omni는 물리 환경의 원인·결과를 이해하고 이를 기반으로 편집 지시에 반응한다.
대화형 편집의 구체적 기능
핵심 차별화는 대화형 영상 편집이다. '배경을 석양으로 바꿔줘', '카메라를 왼쪽으로 당겨줘'처럼 자연어로 요청하면, 모델이 씬 전체의 컨텍스트를 유지한 채 수정을 적용한다. 기존 AI 영상 모델들이 편집 후 인물·배경 일관성을 잃는 문제를 Omni는 씬 전체 맥락 보존으로 해결한다.
- 멀티모달 입력: 텍스트·음성·이미지·영상 동시 처리
- 물리 시뮬레이션: 스타일 전환이 아닌 환경 이해 기반 편집
- 시퀀스 일관성: 수정 후에도 인물·배경·동작 일관성 유지
- YouTube 연동: YouTube Shorts·YouTube Create 앱과 이번 주 무료 통합
즉시 사용 가능, Veo 완전 대체
Gemini Omni Flash는 발표 당일 Google AI Plus·Pro·Ultra 구독자에게 Gemini 앱과 Google Flow 플랫폼을 통해 제공됐다. Gemini 앱 내 Veo는 Gemini Omni로 대체되며, YouTube Shorts와 YouTube Create 앱 연동은 이번 주 추가 비용 없이 순차 출시된다. OpenAI Sora, Runway, Kling이 경쟁하는 AI 영상 시장에서 구글은 '세계 모델'이라는 포지셔닝으로 차별화를 시도한다.
Related Articles
Google DeepMind가 2026년 5월 12일 Gemini 기반의 AI 마우스 포인터 Magic Pointer를 발표했다. 포인터를 움직이기만 해도 화면 위 콘텐츠를 Gemini가 인식해 즉각적인 AI 지원이 가능하다.
구글이 5월 12일 안드로이드 쇼에서 제미나이 인텔리전스를 공개했다. Galaxy S26·Pixel 10을 시작으로 앱 간 멀티스텝 자동화, 자연어 위젯 생성, 음성-텍스트 변환 기능이 올 여름 배포된다.
구글이 Android와 ChromeOS를 통합한 운영체제에 Gemini AI를 전면 탑재한 새 노트북 플랫폼 'Googlebook'을 발표했다. Acer·ASUS·Dell·HP·Lenovo가 디바이스를 개발 중이며 2026년 하반기 출시 예정이다.
Comments (0)
No comments yet. Be the first to comment!