AI Apr 23, 2026 1 min read
画像生成モデルが視覚理解の中心へ入ってきた。DeepMindはNano Banana ProベースのVision Bananaが、軽量なinstruction tuningだけでSegment Anything系やDepth Anything系と競り合い、複数の2D・3D課題でstate-of-the-artに達したと説明している。
画像生成モデルが視覚理解の中心へ入ってきた。DeepMindはNano Banana ProベースのVision Bananaが、軽量なinstruction tuningだけでSegment Anything系やDepth Anything系と競り合い、複数の2D・3D課題でstate-of-the-artに達したと説明している。
Google AIは2026年3月6日のX投稿で、Nano Banana 2 が Google AI Studio と Vertex AI の Gemini API から利用できると案内した。リンク先のGoogle記事は Nano Banana 2、つまり Gemini 3.1 Flash Image を、実アプリ向けの高品質かつ高速な image model として訴求している。