Kimi K2.6、agent swarmを300体・4,000 stepへ拡張し実ファイル出力を本格化
Original: Moonshot said Kimi K2.6 Agent Swarm scales to 300 sub-agents and 4,000 coordinated steps with file-first outputs View original →
tweetが示したこと
MoonshotのKimi accountは今回のreleaseをいくつかの数字に圧縮した。中心は 300 parallel sub-agents × 4,000 steps per run (up from 100 / 1,500 in K2.5). Outputs are real files, not chat. である。さらに1回のrunで100超のfiles、10万語のliterature review、あるいは2万行datasetを返せると付け加えた。
Kimi accountはMoonshotの主力modelとagent researchのupdateを出す公式チャネルだ。今回もproductとbenchmarkの色が強い。materialなのは“swarm”という言葉そのものではなく、scale、parallelism、artifact outputを一つのlaunch messageで数値化した点にある。
linked K2.6 materialの文脈
リンク先のK2.6 tech blogはtweetよりかなり踏み込んでいる。K2.6をopen-source codingの前進として位置づけたうえで、長時間のengineering例を並べる。ひとつは12時間超・4,000超のtool callでZig上のQwen3.5-0.8B local setupを最適化し、throughputを約15 tokens/secから約193 tokens/secへ上げたというものだ。もうひとつは8年物のexchange-core engineを13時間かけて刷新し、1,000超のtool callと4,000行超のcode変更でmedium throughputを185%引き上げたとする。
同じ記事はAgent SwarmをOpenClawのようなproactive agentや、research previewのClaw Groupsと並べている。ここが重要だ。MoonshotはK2.6を単にpromptするmodelではなく、仕事を分解し、異種specialistへ振り分け、構造化されたartifactとして回収するorchestration systemとして描いているからだ。
次に見るべき点
次の試金石はMoonshotの社内例の外にある。300-way parallelismでのfailure recovery、実際のtask quality、そしてfile-first outputの約束がcurated demoではなく現実のenterprise workflowでも成り立つかを見たい。そこまで確認できれば、K2.6はmulti-agent coding system市場の基準点のひとつになる可能性がある。
Sources: X source tweet · Kimi K2.6 tech blog · Kimi Agent Swarm page
Related Articles
ローカルmultimodal AIの競争が12B級へ入った。Google GemmaはGemma 4 12BをApache 2.0で公開し、画像・音声・テキストを統合的に扱うencoder-free設計を示した。
HNで話題になったのは、コーディング評価が正答率からレビュー品質へ移り始めている点だ。FrontierCodeは、人間のmaintainerが受け入れるかを測ろうとする。
LocalLLaMAで共有されたSWE-rebench 1月結果は、Claude Code先行を維持しつつ上位差の縮小とオープンモデル追い上げを示した。