Google Cloud가 Nano Banana 2와 Nano Banana Pro를 5월 29일 GA로 전환했다. 1K·2K 출력은 정식 지원, 4K는 preview로 남고, Nano Banana 2에는 video input prompt preview가 붙어 이미지 생성 API의 적용 범위가 넓어졌다.
#image-generation
RSS Feedr/singularity 커뮤니티가 Claude Mythos 모델이 이미지 출력을 지원함을 발견했다. Anthropic의 첫 이미지 생성 모델이라는 점에서 주목받고 있다.
이미지 생성 모델이 가장 자주 무너지는 지점은 글자와 레이아웃이라서 이번 업데이트는 실무 영향이 크다. Qwen은 신모델을 내놓으며 텍스트-투-이미지 글로벌 9위와 다국어 타이포그래피 개선을 함께 내세웠다.
OpenAI의 4월 21일 system card는 ChatGPT Images 2.0의 safety tradeoff를 숫자로 공개했다. Thinking mode에서 final blocking 전 policy-violating image 비율이 6.7%였다는 점은, 더 사실적인 image generation과 provenance, biorisk 대응이 하나의 deployment 문제가 됐다는 뜻이다.
HN의 관심은 demo reel이 아니라, 빽빽한 prompt를 얼마나 정확히 지키느냐에 쏠렸다. ChatGPT Images 2.0은 더 넓은 style과 multilingual text를 내세웠지만, 개발자들은 곧바로 hard prompt, text rendering, 가격, 학습 데이터 논쟁으로 끌고 갔다.
Google이 Gemini image generation을 긴 prompt 작성에서 계정 context 활용으로 옮겼다. 미국 Google AI Plus, Pro, Ultra 구독자는 Google Photos와 Nano Banana 2를 연결해 개인 사진과 취향을 반영한 이미지를 만들 수 있다.
Hacker News에서 화제가 된 GitHub 저장소는 Gemini 이미지의 SynthID watermark를 신호 처리만으로 감지하고 약화할 수 있다고 주장했다. 다만 토론은 성과 자체보다 Google의 공식 detector와 맞대조하지 않았다는 점, 그리고 watermark 기반 provenance가 본질적으로 얼마나 취약한지에 더 집중됐다.
xAI가 Grok Imagine의 Quality mode에서 세계 지식과 프롬프트 이해력을 강화했다고 설명했다. 회사는 복잡한 장면, 물리 법칙, 객체 관계, 브랜드·지역·문화 참조를 더 정확히 해석할 수 있다고 주장한다.
Microsoft AI가 2026년 3월 19일 MAI-Image-2를 공개했다. 회사는 Arena.ai 기준으로 자사 text-to-image 역량이 상위 3개 랩 수준에 올라섰다고 설명하며, photorealism, in-image text, scene generation 개선을 전면에 내세웠다.
Google이 X를 통해 Nano Banana 2를 공개하며 자사 최고 수준의 이미지 생성·편집 모델이라고 소개했다. 발표에 따르면 이 모델은 Gemini 앱, Search, 개발자 및 크리에이티브 도구 전반에 당일 롤아웃된다.
구글이 새로운 이미지 생성 AI 모델 'Nano Banana 2'를 출시했습니다. 고급 세계 지식, 피사체 일관성, Flash 속도를 결합하여 전문가 수준의 이미지 생성이 가능한 프로덕션 레디 모델입니다.
구글 딥마인드가 Gemini Flash 기반의 이미지 생성·편집 모델 Nano Banana 2(Gemini 3.1 Flash Image)를 출시했다. 프로급 품질과 빠른 생성 속도를 결합해 출시 직후 이미지 생성 벤치마크 1위를 기록했다.