Skip to content

Google, 모든 입력에서 영상 생성하는 Gemini Omni 공개

Original: Google DeepMind Launches Gemini Omni: Video Generation from Any Input View original →

Read in other languages: English日本語
AI May 21, 2026 By Insights AI (Twitter) 1 min read Source
Google, 모든 입력에서 영상 생성하는 Gemini Omni 공개

Gemini Omni 소개

구글 딥마인드가 2026년 5월 19일 Google I/O에서 Gemini Omni를 공개했다. 텍스트, 이미지, 오디오, 기존 영상 등 모든 입력을 받아 영상을 출력하는 Omni 패밀리의 첫 번째 모델이다. Gemini의 광범위한 세계 지식과 구글의 생성형 미디어 시스템이 결합된 이 모델은 구글이 "세계 이해, 멀티모달리티, 편집 영역의 새로운 도약"이라고 설명한다.

핵심 기능

Gemini Omni Flash는 사진 한 장을 입력하면 다양한 영상 변형을 생성하며, 추가 프롬프트로 구도와 스타일을 변환할 수 있다. 중력, 운동 에너지, 유체 역학 등 물리적 힘에 대한 이해가 향상돼 보다 사실적인 장면 구성이 가능해졌다. Flash 클립은 최대 10초이며, 모든 생성 영상에는 구글의 SynthID 디지털 워터마크가 삽입돼 합성 여부를 추적할 수 있다.

이용 방법

Google AI Plus, Pro, Ultra 구독자는 Gemini 앱과 구글 Flow를 통해 즉시 이용할 수 있다. YouTube Shorts에서도 구독자를 대상으로 제공되며, 18세 이상이라면 YouTube Shorts Remix와 YouTube Create 앱에서 무료로 영상을 생성할 수 있다. 개발자 대상 API는 수 주 내 출시 예정이다.

더 큰 그림

Gemini Omni는 Google I/O 2026의 핵심 발표물 중 하나로, Gemini 3.5 Flash와 개인 AI 에이전트 Gemini Spark와 함께 공개됐다. 순다르 피차이 CEO는 기조연설에서 "우리는 이제 에이전틱 Gemini 시대에 확실히 들어섰다"고 선언했다. 구글은 빠르고 저렴한 Flash 버전을 먼저 출시해 소비자 제품 전반에 AI를 확산시키는 전략을 유지하면서도 기술 프런티어를 지키겠다는 의지를 보여줬다.

Share: Long

Related Articles

AI 21h ago 1 min read

구글이 I/O 2026 키노트(5월 19일)에서 Gemini Omni를 발표했다. Sora·Runway 등 기존 AI 영상 생성기와 달리 물리 환경의 인과관계를 이해하는 '세계 모델'로, 자연어 명령만으로 배경·조명·카메라 앵글을 실시간 수정하는 대화형 편집이 핵심이다. 발표 당일 Veo를 대체해 Google AI 구독자에게 즉시 제공됐다.

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment