Nano Banana 2 LiteとGemini Omni Flash、画像・動画編集をAPI運用へ
Original: Google moves image and video editing into developer APIs View original →
画像と動画編集がAPIワークロードに
生成メディアモデルの競争は、見栄えのよいサンプルだけでは決まらなくなっている。Google DeepMindは2026年6月30日のX投稿で、Nano Banana 2 Liteを画像生成と編集向けの高速・低コストモデルとして紹介した。同じ流れでGemini Omni Flashも示し、会話型の動画編集を開発者向けに広げる形を取った。
“Nano Banana 2 Lite: our fastest, most cost-effective image generation and editing model.”
Google DeepMindの公式アカウントは、Gemini系モデル、研究論文、製品化されたAI機能を並行して発信する。今回の投稿はGoogleのブログ記事に接続しており、Nano Banana 2 LiteとGemini Omni Flashを同じ開発者向けの文脈で扱っている。重要なのは、画像と動画編集が単発のデモではなく、アプリケーションに組み込むAPI作業になりつつあることだ。
具体的な違いは呼び出し回数に出る。画像や動画の編集は、一度の生成で終わらない。商品写真の背景変更、広告素材の比較、チュートリアル動画の短縮、動きの修正など、同じ素材に対して何度も指示を出す。Googleがfastestとcost-effectiveを前面に出す理由はここにある。モデルが十分に安く速ければ、ユーザーは一つのワークフローで数十回試せる。
Gemini Omni Flashはこの考え方を動画へ広げる。会話型動画編集では、モデルがフレーム、指示、前後の一貫性を理解しなければならない。開発者にとっては品質だけでなく、watermark、編集履歴、安全フィルター、肖像や著作権への対応も製品要件になる。
次に見るべき点は、価格、quota、提供地域、そして編集履歴や出所表示の扱いだ。Nano Banana 2 Liteが大規模利用で本当に低コストなら、画像生成は日常的なデザインツールに入りやすくなる。Gemini Omni Flashが場面の一貫性を保てるなら、動画編集の自動化も試験機能から実運用へ近づく。出典: Google DeepMind source tweet · Google blog post
Related Articles
Google DeepMindがGemini Flashベースの新画像生成・編集モデル「Nano Banana 2」(Gemini 3.1 Flash Image)をリリース。Proレベルの品質と超高速生成を兼ね備え、リリース直後に画像生成ベンチマーク1位を達成した。
Google DeepMindのシエラレオネ実験では、問題への取り組み方を尋ねるGeminiクエリが68%から90%へ増えた。8週間、12校、1,763人を対象にしたRCTで、教育AIの評価軸が行動変化へ移っている。
Google DeepMindの新しい音声モデルは、70以上の言語で話し声をストリーミング中に翻訳し、声の調子や速度、ピッチの保持を狙う。Translate、AI Studio、Meetへ段階的に入る。