Cloudflare、Code ModeでMCPのtoken膨張を削り shadow serverも追う

MCPの導入が広がるにつれ、悩みの質も変わってきた。初期の問いは「agentをもっと役立つものにできるか」だったが、今の問いは「企業の中でどう統制可能な形にするか」だ。4月14日のCloudflare記事は、local MCP serverをenterpriseの標準にすると、software supply-chain risk、tool injection risk、そしてITやsecurity teamから見えない運用が同時に増えると指摘する。

その答えとしてCloudflareが出したのが、remote MCP servers、OAuthとidentity checksを担うCloudflare Access、discoveryとpolicy enforcementを集約するMCP server portals、provider切り替えとspend controlを担うAI Gateway、さらにShadow MCP detection用のGateway rulesを組み合わせた構成だ。中でも目立つのはCode Modeである。すべてのtool schemaをmodel contextへ丸ごと押し込むのではなく、portal側が複数のupstream toolsをsearchとexecute中心の小さな面に圧縮し、必要なものだけを段階的に見せる。

Cloudflareはここに具体的な数字も付けた。自社API向けMCP serverではCode Modeでtoken使用量を99.9%削減でき、内部portalの例では52 toolsで約9,400 tokensを使っていた定義が、2つのportal toolsと約600 tokensへ落ちて94%減になったという。これは見た目の最適化ではない。Jira、Google Drive、code repository、docs、internal systemsを一つのagent surfaceに束ね始めると、context bloatはそのままcostとreliabilityの問題になる。

security面も重い。Cloudflareはhostname rules、/mcpや/mcp/sseのようなURL path checks、そしてtools/callやinitializeといったJSON-RPC method namesを見るbody inspectionで、未承認のMCP trafficを検知するやり方を示した。要するに、MCPはもはやLLMとおもちゃのdatabaseをつなぐ趣味の橋ではない。infrastructureになりつつある。そうなるとcost controls、authentication、DLP、logging、policyは飾りではなく、本体そのものになる。

Cloudflare、Code ModeでMCPのtoken膨張を削り shadow serverも追う

Related Articles

StarletteのBadHost、vLLMとMCPサーバー運用者が確認すべき理由

GitHub、MCP Server経由でAI coding agentにsecret scanningを追加

Cloudflare、MCP設計を2ツール化しトークン消費を99.9%削減

Comments (0)

Leave a Comment

Related Articles

StarletteのBadHost、vLLMとMCPサーバー運用者が確認すべき理由

GitHub、MCP Server経由でAI coding agentにsecret scanningを追加
LLM Mar 21, 2026 1 min read

Cloudflare、MCP設計を2ツール化しトークン消費を99.9%削減
LLM Apr 15, 2026 1 min read