Gemini Embedding 2 GA、5 modality検索を単一vector layerへ統合
Original: Gemini Embedding 2 is generally available through Gemini API and Gemini Enterprise Agent Platform View original →
tweetが示したこと
Google AI StudioはGemini Embedding 2をgeneral availabilityへ移し、multimodal retrievalを前面に出した。中心になる文は Gemini Embedding 2 is now generally available via the Gemini API and Gemini Enterprise Agent Platform. Search and understand semantic relationships across text, image, video, audio, and documents without complex, fragmented pipelines. だ。
Google AI StudioはGeminiのdeveloper-facing channelである。そのため、このpostはsearch、recommendation、RAG、agent memoryの下に置くembedding modelを選ぶbuilders向けだ。重要なのは範囲である。tweetはtext、image、video、audio、documentsという5種類のinputを1つのembedding layerで扱うと説明している。
Google embedding workの文脈
GoogleのGemini Embedding関連資料は、このmodel familyをmultilingualかつmultimodalなapplicationsのretrieval primitiveとして位置づける。以前のdocumentationでは、長いinput、configurable output dimensions、複数API surfaceでの利用が強調されていた。今回のtweetは運用上のsignalを加えている。Gemini Embedding 2がGemini APIとGemini Enterprise Agent PlatformでGAになった、という点だ。
embeddingは目立つfeatureというよりinfrastructureである。documents、images、transcripts、video-derived contextを一度embeddingすると、model変更には大規模corpusのre-indexingとranking thresholdの再調整が伴う。GA labelは、Gemini Embedding 2をexperimentではなくproduction candidateとして見る理由になる。
enterprise angleも大きい。agent platformはslide deck、support screenshot、meeting audio、PDF、product videoのようなmessy business dataを記憶し検索する必要がある。単一のmultimodal embedding pathはrouting complexityを下げうる。ただしevaluation workは残る。teamsはrecall test、language-specific check、latency measurement、cost comparisonをspecialized text/vision embeddersと比べなければならない。
次に見るべき点はmigration guidanceである。model ID、旧embedderのdeprecation timeline、index-size変化、mixed-media enterprise corpusでのbenchmarkが必要だ。source tweetはGA signalであり、production buyersにはdocsとmodel cardがre-embeddingの判断材料になる。
Sources: X source tweet · linked source
Related Articles
Google DeepMindはGoogle I/O 2026にて、テキスト・画像・音声・動画などあらゆる入力から動画を生成するGemini Omniを発表した。GeminiのインテリジェンスとGoogleのメディア生成システムを統合し、GeminiアプリやYouTube Shortsで即日利用可能だ。
Googleは2026年3月26日、Search LiveをAI Mode対応の全言語・全地域へ拡大した。Voiceとcameraを使うmultimodal searchが200超の国・地域に広がり、Gemini 3.1 Flash Liveの実運用範囲も一気に拡大した。
GoogleがNotebookLMのCinematic Video OverviewsをGoogle AI Ultraユーザー向けに英語で展開開始した。公式ブログによると、Gemini 3、Nano Banana Pro、Veo 3を組み合わせ、従来の narrated slides より没入感の高い動画を生成する。