Cloudflare、Workers AI に Kimi K2.5 を追加し agent 向け推論基盤も強化
Original: Kimi K2.5 is now on Workers AI, helping you power agents entirely on Cloudflare’s Developer Platform. Learn how we optimized our inference stack and reduced inference costs for internal agent use cases. https://t.co/kEQ6HHpoJS View original →
2026年3月19日、CloudflareはXで Moonshot AI の Kimi K2.5 が Workers AI で利用可能になったと発表した。関連する blog post では、Workers AI が frontier open-source model を直接提供する “big models” フェーズに入ると説明されており、その第一弾が Kimi K2.5 だ。
Cloudflareがこのモデルを agentic workload に向くとみる理由も明確だ。Kimi K2.5 は 256k context window に加え、multi-turn tool calling、vision input、structured output を備えるという。これは長い状態を持つ agent workflow に適している。さらに Cloudflare は、Durable Objects による state、Workflows による長時間処理、sandboxed execution surface による tool 実行といった既存の primitive とモデルを同じ platform に統合し、agent のライフサイクル全体を一か所で回せるようにする考えだ。
- Cloudflareは独自の Infire inference engine 上に Kimi K2.5 向け custom kernel を構築したとしている。
- Workers AI は cached token を usage metric として可視化し、fresh input token より安い料金を設定する。
- 新しい `x-session-affinity` header は multi-turn agent session で prefix cache hit rate を高め、latency と cost を下げる狙いだ。
重要なのは、単なる model availability ではないことだ。モデルを載せるだけなら多くの platform ができる。Cloudflareは serving optimization、stateful primitive、agent infrastructure を同じ stack にまとめることで、open-source frontier model を使いたい開発者が self-hosting や kernel tuning、cache-aware routing を自前で抱え込まずに済むよう差別化しようとしている。
Cloudflare は Agents SDK starter の default model も Kimi K2.5 に切り替えたと説明している。つまり今回の launch は単なる catalog 更新ではなく、実際の agent 開発 workflow に直結させる意図が強い。元のX postは こちら、詳細は Cloudflare にある。
Related Articles
Cloudflareは2026年3月19日、Workers AI に Moonshot AI の Kimi K2.5 を追加して large-model tier に入った。durable agent execution、large-context inference、lower-cost open model deployment を 1 つの stack にまとめる戦略が中心だ。
Cloudflareは2026年3月20日、Kimi K2.5をWorkers AIに載せ、Cloudflare Developer Platform上でend-to-end agentを構築・運用できると発表した。公式ブログでは256k context、multi-turn tool calling、vision inputs、structured outputsに加え、1日7B tokensを処理する内部security review agentで77%のコスト削減を示している。
Cloudflareは2026年3月20日、Kimi K2.5をWorkers AIで提供し、agentを自社platform上でend-to-endに実行できるようにしたと発表した。リンク先のCloudflare blogは、256K context、multi-turn tool calling、vision、structured outputsに加え、ある内部agent workloadでコストを77%削減したと説明している。
Comments (0)
No comments yet. Be the first to comment!