Cloudflare、Workers AIでKimi K2.5から大規模open-source model提供を開始
Original: Powering the agents: Workers AI now runs large models, starting with Kimi K2.5 View original →
何が始まったか
Cloudflareは2026年3月19日、Workers AIがfrontier-scale open-source modelの実行に対応し、その第一弾としてMoonshot AIのKimi K2.5を提供すると発表した。Cloudflareは、Kimi K2.5が256k context window、multi-turn tool calling、vision inputs、structured outputsを備えており、agentic workloadに向くと説明している。
今回の発表でCloudflareが強調したのは、単にmodelを追加したという点よりも、"single, unified platform"という位置づけだ。大規模modelをWorkers AIに置くことで、agentの推論、tool利用、state管理、workflow実行までをCloudflare Developer Platformの中で完結させる狙いを示した。
コストと運用の意味
Cloudflareは、Kimi K2.5をすでに社内のOpenCode環境と、public code review agentであるBonkで使っているという。特にcode security review agentの一つは1日あたり7B tokens超を処理し、単一codebaseで15件超のconfirmed issueを見つけたとしている。Cloudflareは、このworkloadをmid-tier proprietary modelで回した場合の年間コストが約$2.4Mになったはずだが、Workers AI上のKimi K2.5へ切り替えることで77%削減できたと主張した。
これはopen-source modelが単なる安価な代替ではなく、production-grade agent運用の本命になり得ることを示す。large context、tool use、高いcost efficiencyがそろえば、enterpriseはproprietary APIへの依存を下げながら、coding、review、security automationのような反復的なagent作業をより大きく増やせる。
なぜ重要か
AI infra競争は、model accessそのものからagent stack統合へ移っている。Cloudflareの発表は、developer platform事業者がfrontier open-source modelとworkflow primitivesを束ね、別のorchestration layerなしでagent applicationを動かせる世界を狙っていることを示す。これはinference economicsとdeveloper convenienceの両面で競争を強める動きだ。
Related Articles
Perplexityは2026年3月11日、search、tool execution、multi-model orchestrationをまとめたAgent APIを発表した。今回の公開によって、Perplexityは単なるanswer interfaceよりも、production agent workflow向けのruntime providerとしての色を強めている。
OpenAIは2026年3月11日、AI agentが読むemail、web page、calendar inviteのようなuntrusted contentを主要なsecurity boundaryとして扱う新ガイドを公開した。堅牢なagentはdataとinstructionを分離し、least privilegeを徹底し、重要なactionの前にmonitoringとuser confirmationを入れるべきだとしている。
OpenAIは2026年3月9日、Promptfooの買収計画を公表し、そのAI security toolingをOpenAI Frontierに組み込む方針を示した。enterprise agent開発でsecurity testing、red-teaming、governanceを標準workflowへ近づける動きだ。
Comments (0)
No comments yet. Be the first to comment!