Cloudflare、Workers AIでKimi K2.5から大規模open-source model提供を開始

Original: Powering the agents: Workers AI now runs large models, starting with Kimi K2.5 View original →

Read in other languages: 한국어English
LLM Mar 20, 2026 By Insights AI 1 min read Source

何が始まったか

Cloudflareは2026年3月19日、Workers AIがfrontier-scale open-source modelの実行に対応し、その第一弾としてMoonshot AIのKimi K2.5を提供すると発表した。Cloudflareは、Kimi K2.5が256k context window、multi-turn tool calling、vision inputs、structured outputsを備えており、agentic workloadに向くと説明している。

今回の発表でCloudflareが強調したのは、単にmodelを追加したという点よりも、"single, unified platform"という位置づけだ。大規模modelをWorkers AIに置くことで、agentの推論、tool利用、state管理、workflow実行までをCloudflare Developer Platformの中で完結させる狙いを示した。

コストと運用の意味

Cloudflareは、Kimi K2.5をすでに社内のOpenCode環境と、public code review agentであるBonkで使っているという。特にcode security review agentの一つは1日あたり7B tokens超を処理し、単一codebaseで15件超のconfirmed issueを見つけたとしている。Cloudflareは、このworkloadをmid-tier proprietary modelで回した場合の年間コストが約$2.4Mになったはずだが、Workers AI上のKimi K2.5へ切り替えることで77%削減できたと主張した。

これはopen-source modelが単なる安価な代替ではなく、production-grade agent運用の本命になり得ることを示す。large context、tool use、高いcost efficiencyがそろえば、enterpriseはproprietary APIへの依存を下げながら、coding、review、security automationのような反復的なagent作業をより大きく増やせる。

なぜ重要か

AI infra競争は、model accessそのものからagent stack統合へ移っている。Cloudflareの発表は、developer platform事業者がfrontier open-source modelとworkflow primitivesを束ね、別のorchestration layerなしでagent applicationを動かせる世界を狙っていることを示す。これはinference economicsとdeveloper convenienceの両面で競争を強める動きだ。

Share: Long

Related Articles

LLM 4d ago 1 min read

Perplexityは2026年3月11日、search、tool execution、multi-model orchestrationをまとめたAgent APIを発表した。今回の公開によって、Perplexityは単なるanswer interfaceよりも、production agent workflow向けのruntime providerとしての色を強めている。

LLM 5d ago 1 min read

OpenAIは2026年3月11日、AI agentが読むemail、web page、calendar inviteのようなuntrusted contentを主要なsecurity boundaryとして扱う新ガイドを公開した。堅牢なagentはdataとinstructionを分離し、least privilegeを徹底し、重要なactionの前にmonitoringとuser confirmationを入れるべきだとしている。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.