Microsoft AI, MAI-Image-2 공개… photorealism·in-image text·creative workflow 강화
Original: Introducing MAI-Image-2: for limitless creativity View original →
Microsoft AI는 2026년 3월 19일 MAI-Image-2를 공개하며 text-to-image 경쟁에 다시 속도를 붙였다. 회사는 이번 출시로 자사 lab이 Arena.ai의 text-to-image leaderboard에서 top 3 수준에 올라섰다고 설명했고, 모델을 곧바로 MAI Playground에 배치했다. 포인트는 단순한 시연용 모델이 아니라 실제 creative workflow에서 결과물을 더 빨리 usable 상태로 만드는 데 있다는 점이다.
Microsoft가 강조한 개선점
발표문에서 가장 먼저 나온 축은 photorealism이다. Microsoft AI는 photographers, designers, visual storytellers와 대화하며 실무에서 자주 부딪히는 실패 지점을 정리했다고 밝혔고, 그 결과 자연광 표현, 정확한 skin tone, 사람이 실제로 살고 있는 듯한 배경 묘사를 우선순위로 삼았다. 샘플 이미지가 화려해 보이는 수준을 넘어서, 처음 생성된 결과물이 post-production으로 넘어가기 전에 얼마나 덜 손봐도 되는지가 경쟁력이라는 판단이다.
둘째는 in-image text reliability다. 포스터 typography, 장면 안 signage, infographic, slide, diagram처럼 텍스트가 결과물의 일부인 작업에서 지시와 출력 사이의 손실을 줄이는 데 초점을 맞췄다. 이는 marketing asset, presentation, UI mockup, branded social creative처럼 text accuracy가 곧 실무 품질로 연결되는 영역에서 특히 중요하다. 동시에 Microsoft는 surreal concept, ornate composition, hyper-detailed world 같은 복잡한 scene generation도 강화했다고 설명했다.
왜 중요한가
MAI-Image-2 발표는 image model 경쟁의 기준이 바뀌고 있다는 신호이기도 하다. 업계가 이제는 한 장의 인상적인 샘플보다 반복 가능한 production quality, art direction 반영도, workflow 적합성을 더 중시하기 시작했기 때문이다. Microsoft AI는 이 흐름에 맞춰 모델 품질을 creative work의 언어로 설명하고 있다. MAI Playground를 통해 공개 첫날부터 직접 시험하고 피드백을 보낼 수 있게 한 것도 같은 맥락이다. 만약 Microsoft가 주장한 photorealism과 text fidelity 향상이 실제 사용에서도 재현된다면, MAI-Image-2는 image generation을 Microsoft AI 포트폴리오의 주력 전선으로 다시 끌어올리는 계기가 될 수 있다.
Related Articles
Google Cloud가 Nano Banana 2와 Nano Banana Pro를 5월 29일 GA로 전환했다. 1K·2K 출력은 정식 지원, 4K는 preview로 남고, Nano Banana 2에는 video input prompt preview가 붙어 이미지 생성 API의 적용 범위가 넓어졌다.
미국 NIST 산하 인공지능표준혁신센터(CAISI)가 5월 5일 Google DeepMind, Microsoft, xAI와 프런티어 AI 모델의 공개 전 국가안보 평가 협정을 체결했다. OpenAI와 Anthropic은 기존 협정을 재협상했다.
알파벳·마이크로소프트·메타·아마존의 2026년 Q1 실적 발표에서 AI 인프라 총 투자액이 최대 7250억 달러로 집계됐다. 구글 클라우드는 처음으로 분기 200억 달러를 돌파했고, 마이크로소프트 AI 사업은 연간 370억 달러 매출을 기록했다.
Comments (0)
No comments yet. Be the first to comment!