Microsoft AI、MAI-Image-2公開 photorealism・in-image text・creative workflowを強化
Original: Introducing MAI-Image-2: for limitless creativity View original →
Microsoft AIは2026年3月19日、MAI-Image-2を発表し、text-to-image競争で再び存在感を強めた。同社は今回の公開によって自社labがArena.aiのtext-to-image leaderboardでtop 3水準に入ったと説明し、モデルをすぐにMAI Playgroundで試せるようにした。焦点は単なるデモではなく、実際のcreative workflowでそのまま使える品質にどこまで近づけるかにある。
Microsoftが前面に出した改善点
発表文で最初に強調されたのはphotorealismだ。Microsoft AIはphotographers、designers、visual storytellersと話し、日常のcreative workで何が最も大きな摩擦になるかを整理したという。その結果、自然光の表現、正確なskin tone、作り物ではなく lived-in に見える環境描写を優先した。見栄えの良いサンプルを並べるだけでなく、生成直後の画像がどこまでpost-productionの負担を減らせるかを競争力に据えている。
第2の柱はin-image text reliabilityだ。ポスターのtypography、scene内のsignage、infographic、slide、diagramのように、画像内テキストそのものが成果物になる用途で、指示と出力のズレを減らすことを狙っている。これはmarketing asset、presentation、UI mockup、branded social creativeのようにtext accuracyが実務品質へ直結する領域で特に重要だ。同時にMicrosoftは、surreal concept、ornate composition、hyper-detailed worldのような複雑なscene generationも強化したと説明している。
なぜ重要なのか
MAI-Image-2の発表は、image model競争の評価軸が変わっていることも示している。市場は単発の印象的なサンプルより、repeatability、workflow適合性、art directionへの追従性を重視し始めているからだ。Microsoft AIはその流れに合わせて、モデルの価値をcreative workの言葉で説明している。公開初日からMAI Playgroundで直接試し、feedbackを返せるようにしたのも同じ文脈だ。Microsoftが主張するphotorealismとtext fidelityの改善が実運用でも再現されるなら、MAI-Image-2はimage generation分野でのMicrosoft AIの立ち位置を一段押し上げる可能性がある。
Related Articles
Google Cloudは5月29日、Nano Banana 2とNano Banana ProをGAに移した。1K・2K出力は正式対応、4Kはpreviewのまま、Nano Banana 2にはvideo input promptのpreviewが加わった。
米国AI基準革新センター(CASI)がGoogle DeepMind、Microsoft、xAIと合意し、新型フロンティアAIモデルの国家安全保障リスクを公開前に評価することになった。Anthropicの自律型ハッキングモデル「Claude Mythos」への懸念が政策転換を後押しした。
米国商務省NIST傘下のCAISI(旧AISI)が2026年5月5日、Google DeepMind・Microsoft・xAIとフロンティアAIモデルの公開前国家安全保障評価に関する協定を締結した。サイバー・バイオ・化学兵器リスクを中心に評価する。
Comments (0)
No comments yet. Be the first to comment!