Google Agentic RAG、足りない根拠を探し直す企業検索へ
Original: Unlocking dependable responses with Gemini Enterprise Agent Platform’s Agentic RAG View original →
企業向けRAGの弱点は、情報がないことではなく、必要な根拠が別の場所にあるのに早く止まってしまうことだ。 Google Researchは2026年6月5日、Gemini Enterprise Agent PlatformのAgentic RAGを公開previewとして示し、標準RAGに比べてfactualityデータセットの精度を最大34%改善したと説明した。
典型的な失敗は、企業内検索でよく起きる。ユーザーが「Project Xで使われたサーバーの仕様」を尋ねても、最初に見つかる文書にはProject XとサーバーIDしか書かれていない場合がある。実際の仕様は別のデータベースにある。従来のRAGはそこで部分的な答えを作るか、「見つからない」と返しやすい。
Googleの設計は、この処理を複数のagentに分解する。Root Agentが依頼を解釈し、Planner Agentが確認すべきデータ経路を決める。Query Rewriterは大きな質問を検索しやすい小さな問いに直し、Search Fanout Agentが複数の検索を走らせる。中心になるのはSufficient Context Agentで、取得した文章片、中間回答、欠けている情報の分析を見て、答えるだけの根拠があるかを判定する。
根拠が足りなければ、処理はそこで終わらない。Googleの例では、医師が退院時の薬、食事制限、アレルギー反応を同時に尋ねる。最初の検索で薬と食事だけ見つかった場合、Sufficient Context Agentはアレルギー反応の根拠が不足していると判断し、発疹や有害事象などを狙った追加検索へつなげる。
評価では、FRAMESをもとにしたFramesQAの824問と2,676本のPDF文書コーパスが使われた。さらにcross-corpus設定では、Planner Agentが4つのデータセットから適切な検索先を選ぶ必要がある。この条件でも90.1%の正答率を示し、single-corpus版とのlatency差は平均3%以内だったという。
企業利用で重要なのは、流暢さより検証可能性である。会計、プロジェクト管理、顧客記録、社内ポリシーを横断するagentでは、最初の検索結果だけで答えたか、足りない情報を認識して探し直したかが信頼性を分ける。次の焦点は、実データ環境で権限管理、監査ログ、検索コスト、応答時間がこの反復構造に耐えられるかだ。
Related Articles
NVIDIAは550BパラメータのMoEモデルを、Agent ToolkitやOpenShellと一体で打ち出した。最大5倍の推論速度、最大30%のコスト低下、6月4日の提供開始が焦点になる。
GoogleはI/O 2026でGemini 3.5 Flashを公開し、エージェントAI時代の到来を宣言した。Managed Agents APIは1回のAPI呼び出しで完全な自律実行環境を提供する。
Google I/O 2026の焦点は、Geminiを単独アプリではなく実行レイヤーとして広げることにある。Gemini 3.5 FlashはAPI、Antigravity、Android Studio、Search、Gemini appへ広がり、Gemini Omni Flashはvideo生成を同じ流れに乗せる。