Google、Gemini Embedding 2を公開 テキスト・画像・音声・動画・文書を単一ベクトル空間へ
Original: Gemini Embedding 2: Our first natively multimodal embedding model View original →
Google AI Studioは2026-03-12のX投稿で、Gemini Embedding 2がtext、images、audio、video、docsを1つのvector spaceに載せると紹介した。これに対応するGoogleの2026-03-10ブログ記事では、Gemini Embedding 2をGemini architecture上に構築した初のfully multimodal embedding modelと位置付け、Gemini APIとVertex AIでpublic previewとして提供していると説明している。
embedding modelの重要性は、検索、推薦、clustering、classification、RAGのような基盤処理を支えている点にある。従来はtext向け、image向け、audio向けといった形でpipelineが分かれやすかった。Googleの今回の主張は、その分断を減らし、text、images、videos、audio、documentsを1つのunified embedding spaceで扱えるようにするというものだ。
公式記事によると、Gemini Embedding 2は100+ languagesでsemantic intentを捉え、multimodal retrievalやclassificationに使える。GoogleはGemini API、Vertex AI、さらに軽量なsemantic search demoも案内している。加えて、speech capabilitiesを含むmultimodal depthで高い性能を示し、text、image、videoの課題でleading modelsを上回ったと述べている。ここでのbenchmark評価はGoogle自身の公表内容であり、その前提で読む必要がある。
最も具体的な利用例として、GoogleはParamount Skydanceの事例を紹介している。記事では、text queryから対応するvideo assetを引き当て、未転写のmicro-expressionsまで検索対象にできたとし、text-to-video Recall@1が85.3%に達したと説明している。もしこうした結果が他のmedia workflowにも広がるなら、multimodal embeddingは研究トピックではなく実運用の標準基盤に近づくことになる。
開発者にとっての意味は明快だ。単一embedding spaceが成立すれば、multimodal searchやRAG stackの設計はかなり単純化できる。domain dataでの検証は依然として必要だが、Googleがmixed media検索をdefault infrastructureへ押し上げようとしているシグナルとして、今回の発表は十分に重い。
Primary sources: Google AI Studio on X and Google blog.
Related Articles
Googleは2026年3月10日、Gemini Embedding 2をpublic previewで公開した。会社はこのmodelがtext、image、PDFのようなmixed multimodal documentを1つのembedding spaceで扱い、benchmark scoreを68.32と53.3まで高めつつ価格とvector dimensionsは維持すると説明している。
GoogleはGemini APIとVertex AIでGemini Embedding 2のプレビュー提供を開始した。text、image、video、audio、documentを1つのembedding spaceに配置する、同社初のネイティブなマルチモーダル embedding システムだ。
Google DeepMindはXで、Gemini Embedding 2をGemini APIとVertex AIでpreview提供すると発表した。Gemini architectureベース初のfully multimodal embedding modelとして、text・image・video・audio・documentsを横断するretrieval基盤を狙う。
Comments (0)
No comments yet. Be the first to comment!