Kimi K2.6、agent swarmを300体・4,000 stepへ拡張し実ファイル出力を本格化
Original: Moonshot said Kimi K2.6 Agent Swarm scales to 300 sub-agents and 4,000 coordinated steps with file-first outputs View original →
tweetが示したこと
MoonshotのKimi accountは今回のreleaseをいくつかの数字に圧縮した。中心は 300 parallel sub-agents × 4,000 steps per run (up from 100 / 1,500 in K2.5). Outputs are real files, not chat. である。さらに1回のrunで100超のfiles、10万語のliterature review、あるいは2万行datasetを返せると付け加えた。
Kimi accountはMoonshotの主力modelとagent researchのupdateを出す公式チャネルだ。今回もproductとbenchmarkの色が強い。materialなのは“swarm”という言葉そのものではなく、scale、parallelism、artifact outputを一つのlaunch messageで数値化した点にある。
linked K2.6 materialの文脈
リンク先のK2.6 tech blogはtweetよりかなり踏み込んでいる。K2.6をopen-source codingの前進として位置づけたうえで、長時間のengineering例を並べる。ひとつは12時間超・4,000超のtool callでZig上のQwen3.5-0.8B local setupを最適化し、throughputを約15 tokens/secから約193 tokens/secへ上げたというものだ。もうひとつは8年物のexchange-core engineを13時間かけて刷新し、1,000超のtool callと4,000行超のcode変更でmedium throughputを185%引き上げたとする。
同じ記事はAgent SwarmをOpenClawのようなproactive agentや、research previewのClaw Groupsと並べている。ここが重要だ。MoonshotはK2.6を単にpromptするmodelではなく、仕事を分解し、異種specialistへ振り分け、構造化されたartifactとして回収するorchestration systemとして描いているからだ。
次に見るべき点
次の試金石はMoonshotの社内例の外にある。300-way parallelismでのfailure recovery、実際のtask quality、そしてfile-first outputの約束がcurated demoではなく現実のenterprise workflowでも成り立つかを見たい。そこまで確認できれば、K2.6はmulti-agent coding system市場の基準点のひとつになる可能性がある。
Sources: X source tweet · Kimi K2.6 tech blog · Kimi Agent Swarm page
Related Articles
r/LocalLLaMAが反応したのはleaderboardの順位だけではなく、Opus 4.7のscoreと実使用感のズレ、Kimi K2.6のcoding agent適性だった。
HNはKimi K2.6を、benchmark表よりも「open-weight coding agentが長い実務を耐えられるか」という問いで読んだ。12時間、13時間のcoding事例が注目を集める一方、速度、provider品質、benchmarkの現実味もすぐに問われた。
なぜ重要か: coding agentが実験用途から本番インフラへ移ると、権限、費用、監査ログが分散しやすい。Databricksはcoding agents、LLM calls、MCP integrationsをgovernance、budgets、observabilityの3軸で管理する構えを示した。
Comments (0)
No comments yet. Be the first to comment!