Cloudflare AI Search、agentごとにBM25とvector indexを持つ

Original: AI Search: the search primitive for your agents View original →

Read in other languages: 한국어English
LLM Apr 17, 2026 By Insights AI 1 min read 1 views Source

Agent stackにおいてretrievalは周辺機能ではなく、demoを超えて動くかどうかを決める主要な経路になっている。Cloudflareは2026年4月16日の記事で、AutoRAGをAI Searchとして再構成し、Workers、Agents SDK、Wrangler CLIから使えるsearch primitiveとして位置づけた。

大きな変更は、vector searchだけを前提にしないことだ。Cloudflareは、vector searchはintentを捉えられる一方で、「ERR_CONNECTION_REFUSED timeout」のような正確なtermを落としやすいと説明する。AI SearchはBM25 keyword matchingをvectorと並べて実行できる。Hybrid searchでは両方の結果をparallelに取得し、reciprocal rank fusionまたはmax fusionでまとめる。必要ならrerankerも追加できる。

構築手順も軽くなった。新しいAI Search instanceにはstorageとvector indexが組み込まれ、APIでfileをuploadしてindexingを待てばすぐsearchできる。ai_search_namespaces bindingにより、Workerはruntimeでinstanceを作成・削除できる。Production agentではcustomer別、language別、tenant別、agent別にcontextを分けたい場面が多く、このruntime作成は実務上の差になる。

Cloudflareのsupport agent例は使い方をよく示している。Shared product docsは1つのinstanceに置き、customerごとのpast resolutionは別instanceに保存する。Ticket対応時、agentはproduct knowledgeとそのcustomer historyを1回のcallで横断検索する。解決後はsummaryを保存し、次回の会話で即座に検索できる。Metadata boostingで新しい文書や重要文書を上位に出すことも可能だ。

Open betaの制限は具体的だ。Workers Freeはaccountあたり100 AI Search instances、instanceあたり100,000 files、月20,000 queries、1日500 crawled pagesを提供する。Workers Paidでは5,000 instances、1M filesまたはhybrid searchで500K files、unlimited queries、unlimited crawled pagesとなる。Beta期間中は無料で、billing前には少なくとも30 days noticeがある。Agentがsearch infraを抱え込む段階から、platform primitiveを選ぶ段階へ移ったという読み方ができる。

Share: Long

Related Articles

LLM 2d ago 1 min read

CloudflareはAI Gatewayをagent向けの統合inference layerへ寄せ、Workers AIから70+ models、12+ providersを同じAPIで呼べるようにした。重要なのはcatalogだけではなく、10回前後のinferenceをつなぐagent workflowでcost、retry、failoverを一箇所に寄せる点だ。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.