Microsoft AI, MAI-Image-2 공개… photorealism·in-image text·creative workflow 강화

Microsoft AI는 2026년 3월 19일 MAI-Image-2를 공개하며 text-to-image 경쟁에 다시 속도를 붙였다. 회사는 이번 출시로 자사 lab이 Arena.ai의 text-to-image leaderboard에서 top 3 수준에 올라섰다고 설명했고, 모델을 곧바로 MAI Playground에 배치했다. 포인트는 단순한 시연용 모델이 아니라 실제 creative workflow에서 결과물을 더 빨리 usable 상태로 만드는 데 있다는 점이다.

Microsoft가 강조한 개선점

발표문에서 가장 먼저 나온 축은 photorealism이다. Microsoft AI는 photographers, designers, visual storytellers와 대화하며 실무에서 자주 부딪히는 실패 지점을 정리했다고 밝혔고, 그 결과 자연광 표현, 정확한 skin tone, 사람이 실제로 살고 있는 듯한 배경 묘사를 우선순위로 삼았다. 샘플 이미지가 화려해 보이는 수준을 넘어서, 처음 생성된 결과물이 post-production으로 넘어가기 전에 얼마나 덜 손봐도 되는지가 경쟁력이라는 판단이다.

둘째는 in-image text reliability다. 포스터 typography, 장면 안 signage, infographic, slide, diagram처럼 텍스트가 결과물의 일부인 작업에서 지시와 출력 사이의 손실을 줄이는 데 초점을 맞췄다. 이는 marketing asset, presentation, UI mockup, branded social creative처럼 text accuracy가 곧 실무 품질로 연결되는 영역에서 특히 중요하다. 동시에 Microsoft는 surreal concept, ornate composition, hyper-detailed world 같은 복잡한 scene generation도 강화했다고 설명했다.

왜 중요한가

MAI-Image-2 발표는 image model 경쟁의 기준이 바뀌고 있다는 신호이기도 하다. 업계가 이제는 한 장의 인상적인 샘플보다 반복 가능한 production quality, art direction 반영도, workflow 적합성을 더 중시하기 시작했기 때문이다. Microsoft AI는 이 흐름에 맞춰 모델 품질을 creative work의 언어로 설명하고 있다. MAI Playground를 통해 공개 첫날부터 직접 시험하고 피드백을 보낼 수 있게 한 것도 같은 맥락이다. 만약 Microsoft가 주장한 photorealism과 text fidelity 향상이 실제 사용에서도 재현된다면, MAI-Image-2는 image generation을 Microsoft AI 포트폴리오의 주력 전선으로 다시 끌어올리는 계기가 될 수 있다.

Microsoft AI, MAI-Image-2 공개… photorealism·in-image text·creative workflow 강화

Microsoft가 강조한 개선점

왜 중요한가

Related Articles

Nano Banana 2 Lite와 Gemini Omni Flash, 이미지·영상 편집을 개발자 API로 이동

Microsoft, Texas에 2GW AI 데이터센터… 전력까지 자체 조달

NVIDIA Cosmos 3, 교통 영상 QA 정확도 54.41%에서 93.35%로 상승한 결과