Google Cloudは5月29日、Nano Banana 2とNano Banana ProをGAに移した。1K・2K出力は正式対応、4Kはpreviewのまま、Nano Banana 2にはvideo input promptのpreviewが加わった。
#image-generation
RSS Feedr/singularityコミュニティがClaude Mythosモデルの画像出力機能を発見。Anthropic初の画像生成モデルとして注目を集めている。
画像モデルは文字やレイアウトで崩れやすく、その弱点に手を入れた点が重要だ。Qwenは新モデルを世界9位のText-to-Image評価と結び付け、多言語タイポグラフィの改善も前面に出した。
OpenAIの4月21日のsystem cardは、ChatGPT Images 2.0のsafety tradeoffを具体的な数字で示した。Thinking modeではfinal blocking前のpolicy-violating image比率が6.7%で、より写実的なimage generation、provenance、biorisk対策が一つのdeployment課題になっている。
HNの関心はdemo reelではなく、密度の高いpromptをどこまで守れるかに向かった。ChatGPT Images 2.0はstyle幅やmultilingual textを前面に出したが、threadはprompt adherence、価格、synthetic media疲れへ広がった。
GoogleはGemini image generationを、長いprompt作成からaccount contextの利用へ寄せた。米国のGoogle AI Plus、Pro、Ultra加入者はGoogle PhotosとNano Banana 2を使い、source確認とreference変更をしながらpersonalized imagesを作れる。
Hacker News で注目された GitHub repo は、Gemini 画像の SynthID watermark を signal processing だけで検出し弱められると主張した。だが議論の中心は headline claim そのものより、Google 公式 detector と照合していない点と、watermark ベース provenance の脆さだった。
xAIは、Grok ImagineのQuality modeで世界知識とprompt understandingが強化されると説明した。複雑なシーン、physics、object relationship、ブランドや地域・文化参照の解釈精度が高まるという。
Microsoft AIは2026年3月19日にMAI-Image-2を発表した。Arena.aiのlab leaderboardでtop 3入りしたと同社は位置づけ、photorealism、reliableなin-image text、より豊かなscene generationを前面に出している。
GoogleはXでNano Banana 2を発表し、同社で最高水準の画像生成・編集モデルだと説明した。投稿では、Gemini App、Search、開発者向けおよびクリエイティブツール全体への当日展開が示されている。
Googleが新しいAI画像生成モデル「Nano Banana 2」をリリース。高度な世界知識、被写体の一貫性、Flash速度の生成を組み合わせたプロダクションレディのモデルです。r/singularityで790点以上を獲得しました。
Google DeepMindがGemini Flashベースの新画像生成・編集モデル「Nano Banana 2」(Gemini 3.1 Flash Image)をリリース。Proレベルの品質と超高速生成を兼ね備え、リリース直後に画像生成ベンチマーク1位を達成した。