Cloudflare、Workers AIでKimi K2.5から大規模open-source model提供を開始
Original: Powering the agents: Workers AI now runs large models, starting with Kimi K2.5 View original →
何が始まったか
Cloudflareは2026年3月19日、Workers AIがfrontier-scale open-source modelの実行に対応し、その第一弾としてMoonshot AIのKimi K2.5を提供すると発表した。Cloudflareは、Kimi K2.5が256k context window、multi-turn tool calling、vision inputs、structured outputsを備えており、agentic workloadに向くと説明している。
今回の発表でCloudflareが強調したのは、単にmodelを追加したという点よりも、"single, unified platform"という位置づけだ。大規模modelをWorkers AIに置くことで、agentの推論、tool利用、state管理、workflow実行までをCloudflare Developer Platformの中で完結させる狙いを示した。
コストと運用の意味
Cloudflareは、Kimi K2.5をすでに社内のOpenCode環境と、public code review agentであるBonkで使っているという。特にcode security review agentの一つは1日あたり7B tokens超を処理し、単一codebaseで15件超のconfirmed issueを見つけたとしている。Cloudflareは、このworkloadをmid-tier proprietary modelで回した場合の年間コストが約$2.4Mになったはずだが、Workers AI上のKimi K2.5へ切り替えることで77%削減できたと主張した。
これはopen-source modelが単なる安価な代替ではなく、production-grade agent運用の本命になり得ることを示す。large context、tool use、高いcost efficiencyがそろえば、enterpriseはproprietary APIへの依存を下げながら、coding、review、security automationのような反復的なagent作業をより大きく増やせる。
なぜ重要か
AI infra競争は、model accessそのものからagent stack統合へ移っている。Cloudflareの発表は、developer platform事業者がfrontier open-source modelとworkflow primitivesを束ね、別のorchestration layerなしでagent applicationを動かせる世界を狙っていることを示す。これはinference economicsとdeveloper convenienceの両面で競争を強める動きだ。
Related Articles
Cloudflareは2026年3月20日、Kimi K2.5をWorkers AIに載せ、Cloudflare Developer Platform上でend-to-end agentを構築・運用できると発表した。公式ブログでは256k context、multi-turn tool calling、vision inputs、structured outputsに加え、1日7B tokensを処理する内部security review agentで77%のコスト削減を示している。
Cloudflareは2026年3月19日、Workers AI に Moonshot AI の Kimi K2.5 を追加して large-model tier に入った。durable agent execution、large-context inference、lower-cost open model deployment を 1 つの stack にまとめる戦略が中心だ。
Cloudflareは3月19日にXで、Kimi K2.5 が Workers AI で利用可能になったと発表した。単なるモデル追加ではなく、agent workload の遅延とコストを下げる platform 改善もセットになった launch だ。
Comments (0)
No comments yet. Be the first to comment!