Skip to content
腐食中

Cloudflare、Workers AIでKimi K2.5から大規模open-source model提供を開始

Original: Powering the agents: Workers AI now runs large models, starting with Kimi K2.5 View original →

Read in other languages: 한국어English
LLM Mar 20, 2026 By Insights AI 1 min read 12 views Source

何が始まったか

Cloudflareは2026年3月19日、Workers AIがfrontier-scale open-source modelの実行に対応し、その第一弾としてMoonshot AIのKimi K2.5を提供すると発表した。Cloudflareは、Kimi K2.5が256k context window、multi-turn tool calling、vision inputs、structured outputsを備えており、agentic workloadに向くと説明している。

今回の発表でCloudflareが強調したのは、単にmodelを追加したという点よりも、"single, unified platform"という位置づけだ。大規模modelをWorkers AIに置くことで、agentの推論、tool利用、state管理、workflow実行までをCloudflare Developer Platformの中で完結させる狙いを示した。

コストと運用の意味

Cloudflareは、Kimi K2.5をすでに社内のOpenCode環境と、public code review agentであるBonkで使っているという。特にcode security review agentの一つは1日あたり7B tokens超を処理し、単一codebaseで15件超のconfirmed issueを見つけたとしている。Cloudflareは、このworkloadをmid-tier proprietary modelで回した場合の年間コストが約$2.4Mになったはずだが、Workers AI上のKimi K2.5へ切り替えることで77%削減できたと主張した。

これはopen-source modelが単なる安価な代替ではなく、production-grade agent運用の本命になり得ることを示す。large context、tool use、高いcost efficiencyがそろえば、enterpriseはproprietary APIへの依存を下げながら、coding、review、security automationのような反復的なagent作業をより大きく増やせる。

なぜ重要か

AI infra競争は、model accessそのものからagent stack統合へ移っている。Cloudflareの発表は、developer platform事業者がfrontier open-source modelとworkflow primitivesを束ね、別のorchestration layerなしでagent applicationを動かせる世界を狙っていることを示す。これはinference economicsとdeveloper convenienceの両面で競争を強める動きだ。

Share: Long

Related Articles

LLM X/Twitter Mar 22, 2026 1 min read

Cloudflareは2026年3月20日、Kimi K2.5をWorkers AIに載せ、Cloudflare Developer Platform上でend-to-end agentを構築・運用できると発表した。公式ブログでは256k context、multi-turn tool calling、vision inputs、structured outputsに加え、1日7B tokensを処理する内部security review agentで77%のコスト削減を示している。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment