Cloudflare、Code ModeでMCPのtoken膨張を削り shadow serverも追う
Original: Scaling MCP adoption: Our reference architecture for simpler, safer and cheaper enterprise deployments of MCP View original →
MCPの導入が広がるにつれ、悩みの質も変わってきた。初期の問いは「agentをもっと役立つものにできるか」だったが、今の問いは「企業の中でどう統制可能な形にするか」だ。4月14日のCloudflare記事は、local MCP serverをenterpriseの標準にすると、software supply-chain risk、tool injection risk、そしてITやsecurity teamから見えない運用が同時に増えると指摘する。
その答えとしてCloudflareが出したのが、remote MCP servers、OAuthとidentity checksを担うCloudflare Access、discoveryとpolicy enforcementを集約するMCP server portals、provider切り替えとspend controlを担うAI Gateway、さらにShadow MCP detection用のGateway rulesを組み合わせた構成だ。中でも目立つのはCode Modeである。すべてのtool schemaをmodel contextへ丸ごと押し込むのではなく、portal側が複数のupstream toolsをsearchとexecute中心の小さな面に圧縮し、必要なものだけを段階的に見せる。
Cloudflareはここに具体的な数字も付けた。自社API向けMCP serverではCode Modeでtoken使用量を99.9%削減でき、内部portalの例では52 toolsで約9,400 tokensを使っていた定義が、2つのportal toolsと約600 tokensへ落ちて94%減になったという。これは見た目の最適化ではない。Jira、Google Drive、code repository、docs、internal systemsを一つのagent surfaceに束ね始めると、context bloatはそのままcostとreliabilityの問題になる。
security面も重い。Cloudflareはhostname rules、/mcpや/mcp/sseのようなURL path checks、そしてtools/callやinitializeといったJSON-RPC method namesを見るbody inspectionで、未承認のMCP trafficを検知するやり方を示した。要するに、MCPはもはやLLMとおもちゃのdatabaseをつなぐ趣味の橋ではない。infrastructureになりつつある。そうなるとcost controls、authentication、DLP、logging、policyは飾りではなく、本体そのものになる。
Related Articles
LocalLLaMAでは、抽象的なAI脆弱性の話より、FastAPI・Starlette系のagentサーバーが外部公開されていないかに関心が集まった。
GitHubはAI coding agentがcommitやpull requestの前にGitHub MCP Server経由でsecret scanningを呼び出せるようになったと発表した。この機能はGitHub Secret Protectionを有効にしたrepository向けにpublic previewで提供される。
Cloudflareが企業向けMCP運用の設計図を示した。数字で目を引くのはCode Mode設計による99.9%のtoken削減で、加えて未承認のremote serverを見つけるShadow MCP detectionまで載せたことで、agent導入の争点が性能からコスト・統治・securityへ移っていることが分かる。
Comments (0)
No comments yet. Be the first to comment!