Gemini、Google Photosでimage promptを個人化する
Original: New ways to create personalized images in the Gemini app View original →
Geminiの新しいimage generationで大きいのは、単にmodel qualityが上がることではなく、promptの材料がどこから来るかだ。Googleは2026年4月16日の記事で、Gemini appがPersonal Intelligence、Nano Banana 2、Google Photosを組み合わせ、長いpromptや手作業のreference uploadなしでpersonalな画像を作れるようにすると説明した。
これまでのimage generationでは、人物、場所、好み、style、referenceを細かく書ける人ほど結果を調整しやすかった。今回のGeminiは、ユーザーがGoogle appsを接続している場合、そのcontextをpromptの不足分に使う。「Design my dream house」や「Create a picture of my desert island essentials」のような短い依頼でも、関心や生活の好みを反映できるという位置づけだ。
より重要なのはGoogle Photosとの接続だ。Personal IntelligenceにPhotos libraryを接続すると、Geminiはlibrary内の人物やpet labelを使って生成を導ける。Googleは、家族と好きな活動をしているclaymation imageを作る例を挙げている。ユーザーが写真を探し、downloadし、再びuploadして人物を指定する手間は減る。
ただし、個人写真をAI生成の入力にする以上、privacyの境界が主題になる。GoogleはGemini appがprivate Google Photos libraryを直接model trainingに使わないとしている。一方で、Geminiのpromptやmodel responseなど限られた情報は機能改善に使われる可能性がある。Sources buttonでは自動選択されたimageを確認でき、必要なら別のreference photoを選び直せる。
Rolloutは米国のGoogle AI Plus、Pro、Ultra加入者向けに数日かけて進む。Googleは今後、Gemini in Chrome desktopsとより多くのユーザーにも広げる計画だ。注目点は画像の見栄えだけではない。personal contextがprompt engineeringをどこまで置き換えるのか、そしてユーザーが結果を形作るprivate materialをどれだけ確認し、制御できるのかである。
Related Articles
Google Cloudは5月29日、Nano Banana 2とNano Banana ProをGAに移した。1K・2K出力は正式対応、4Kはpreviewのまま、Nano Banana 2にはvideo input promptのpreviewが加わった。
Hacker News で注目された GitHub repo は、Gemini 画像の SynthID watermark を signal processing だけで検出し弱められると主張した。だが議論の中心は headline claim そのものより、Google 公式 detector と照合していない点と、watermark ベース provenance の脆さだった。
GoogleはXでNano Banana 2を発表し、同社で最高水準の画像生成・編集モデルだと説明した。投稿では、Gemini App、Search、開発者向けおよびクリエイティブツール全体への当日展開が示されている。