Nano Banana 2 Lite와 Gemini Omni Flash, 이미지·영상 편집을 개발자 API로 이동
Original: Google moves image and video editing into developer APIs View original →
이미지와 영상 편집이 API 작업으로 이동
생성형 미디어 모델의 경쟁은 결과물 품질만이 아니라 개발자가 얼마나 자주, 싸게 호출할 수 있는지로 옮겨가고 있다. Google DeepMind는 2026년 6월 30일 X에서 Nano Banana 2 Lite를 소개하며 이미지 생성과 편집을 더 빠르고 저렴한 모델로 제공한다고 밝혔다. 같은 날 Gemini Omni Flash도 공개해 대화형 영상 편집 기능을 개발자에게 열었다.
“Nano Banana 2 Lite: our fastest, most cost-effective image generation and editing model.”
Google DeepMind 계정은 Gemini 계열 모델, 연구 논문, 제품화된 AI 기능을 함께 다루는 공식 채널이다. 이번 게시물은 블로그 글과 연결되어 있다. Google은 Nano Banana 2 Lite를 이미지 생성과 편집에 맞춘 경량 모델로 설명하고, Gemini Omni Flash는 영상 입력을 이해하면서 사용자의 자연어 지시로 장면을 수정하는 방향을 제시한다. 핵심은 이미지와 영상이 각각 별도 데모가 아니라 애플리케이션에 넣을 수 있는 개발자 API가 된다는 점이다.
구체적 숫자로 보면 변화는 사용 빈도에서 드러난다. 미디어 생성 모델은 한 번의 답변보다 반복 수정이 많다. 제품 사진 배경을 바꾸거나, 광고 소재를 A/B 테스트하거나, 튜토리얼 영상을 다듬는 작업은 수십 번 호출될 수 있다. Google이 “fastest”와 “cost-effective”를 전면에 둔 이유도 여기에 있다. 모델이 조금 더 싸고 빠르면 실험 횟수 자체가 늘어난다.
다음 관전점은 결과물 제어와 권리 처리다. 개발자 API로 들어가면 품질뿐 아니라 워터마킹, 안전 필터, 편집 이력, 저작권 리스크가 제품 요건이 된다. Google이 Nano Banana 2 Lite와 Gemini Omni Flash를 어떤 가격, 지역, 할당량으로 제공하는지에 따라 이미지·영상 자동화 도구의 채택 속도가 갈릴 수 있다. 출처: Google DeepMind source tweet · Google blog post
Related Articles
구글 딥마인드가 Gemini Flash 기반의 이미지 생성·편집 모델 Nano Banana 2(Gemini 3.1 Flash Image)를 출시했다. 프로급 품질과 빠른 생성 속도를 결합해 출시 직후 이미지 생성 벤치마크 1위를 기록했다.
Google DeepMind의 Sierra Leone 교실 실험에서 학생들의 문제 접근 질문 비중이 68%에서 90%로 늘었다. 8주간 1,763명을 대상으로 한 RCT라는 점에서 교육용 AI 논의가 사용감이 아니라 행동 변화 지표로 이동했다.
Google DeepMind의 새 오디오 모델은 70개 이상 언어를 스트리밍 중 번역하고 말투와 속도, 음높이를 보존한다. Google Translate, Google AI Studio, Google Meet까지 배포 경로가 나뉜다.