Cloudflare AI Search、agentごとにBM25とvector indexを持つ
Original: AI Search: the search primitive for your agents View original →
Agent stackにおいてretrievalは周辺機能ではなく、demoを超えて動くかどうかを決める主要な経路になっている。Cloudflareは2026年4月16日の記事で、AutoRAGをAI Searchとして再構成し、Workers、Agents SDK、Wrangler CLIから使えるsearch primitiveとして位置づけた。
大きな変更は、vector searchだけを前提にしないことだ。Cloudflareは、vector searchはintentを捉えられる一方で、「ERR_CONNECTION_REFUSED timeout」のような正確なtermを落としやすいと説明する。AI SearchはBM25 keyword matchingをvectorと並べて実行できる。Hybrid searchでは両方の結果をparallelに取得し、reciprocal rank fusionまたはmax fusionでまとめる。必要ならrerankerも追加できる。
構築手順も軽くなった。新しいAI Search instanceにはstorageとvector indexが組み込まれ、APIでfileをuploadしてindexingを待てばすぐsearchできる。ai_search_namespaces bindingにより、Workerはruntimeでinstanceを作成・削除できる。Production agentではcustomer別、language別、tenant別、agent別にcontextを分けたい場面が多く、このruntime作成は実務上の差になる。
Cloudflareのsupport agent例は使い方をよく示している。Shared product docsは1つのinstanceに置き、customerごとのpast resolutionは別instanceに保存する。Ticket対応時、agentはproduct knowledgeとそのcustomer historyを1回のcallで横断検索する。解決後はsummaryを保存し、次回の会話で即座に検索できる。Metadata boostingで新しい文書や重要文書を上位に出すことも可能だ。
Open betaの制限は具体的だ。Workers Freeはaccountあたり100 AI Search instances、instanceあたり100,000 files、月20,000 queries、1日500 crawled pagesを提供する。Workers Paidでは5,000 instances、1M filesまたはhybrid searchで500K files、unlimited queries、unlimited crawled pagesとなる。Beta期間中は無料で、billing前には少なくとも30 days noticeがある。Agentがsearch infraを抱え込む段階から、platform primitiveを選ぶ段階へ移ったという読み方ができる。
Related Articles
Google I/O 2026の焦点は、Geminiを単独アプリではなく実行レイヤーとして広げることにある。Gemini 3.5 FlashはAPI、Antigravity、Android Studio、Search、Gemini appへ広がり、Gemini Omni Flashはvideo生成を同じ流れに乗せる。
Claude Opus 4.8の初期評価は、コーディングだけでなく実務型エージェント作業に広がっている。Artificial AnalysisはGDPval-AAで1890点、GPT-5.5 xhighを121点上回ったとした。
Le ChatはVibeへ変わり、長時間の業務処理とコーディングエージェントを同じ製品にまとめた。Work Mode、Code Mode、VS Code拡張、CLI更新が同時に入り、Proは月額$14.99から始まる。
Comments (0)
No comments yet. Be the first to comment!