#kimi

LLM Hacker News 4d ago 1 min read

Kimi K3とFable、single model固定よりroutingが焦点に

Fireworksは約1,030件のagentic taskでKimi K3とFable 5をroutingし、93% accuracyを得たと説明した。HNで注目されたのは、single model運用が費用面で非効率になりつつあるという主張だ。

#kimi #fireworks #model-routing

AI sources.Axios 6d ago 1 min read

Kimi台頭で米AI政策が再燃、中国open-weightモデル制限論が前面に浮上

焦点はベンチマーク競争から、米企業が中国製open-weightモデルを使えるかどうかへ移っている。Axiosは、Entity List、政府調達、security advisory、ホスティング責任を使った圧力案が再び浮上していると報じた。

#ai-policy #open-weight #china

LLM Hacker News Jul 18, 2026 1 min read

Kimi K3、2.8T open modelがfrontier競争を価格まで揺らす

HNで注目されたのは発表文そのものではなく、2.8T規模のopen modelがfrontier性能と推論コストを同時に問い直した点だった。

#kimi #kimi-k3 #open-models

LLM X/Twitter Jul 3, 2026 1 min read

GitHub Copilot初のopen-weight選択肢にKimi K2.7 Code

Copilotのmodel pickerに初めてopen-weightモデルが入る。GitHubはKimi K2.7 CodeをVS Codeから段階提供し、BusinessとEnterpriseでは管理者のpolicy有効化が必要だとしている。

#github #copilot #kimi

LLM Reddit May 12, 2026 1 min read

製造終了のIntel OptaneメモリでローカルLLM(1兆パラメータ)を毎秒4トークンで動作

r/LocalLLaMAのユーザーが、製造終了したIntel Optane PMem(768GB)を中古市場で安価に入手し、Kimi K2.5(1兆パラメータ)をローカルで毎秒4トークン以上で動作させることに成功した。

#intel-optane #local-llm #llama-cpp

LLM May 7, 2026 1 min read

Kimi開発のMoonshot AI、$2B調達で時価総額$20Bへ — 中国AI史上最大の資金調達

中国AIスタートアップのMoonshot AIがMeituan主導で$2Bを調達し、時価総額$20Bを達成した。過去6か月の累計調達額$3.9Bは中国LLMスタートアップ史上最大規模となった。

#moonshot-ai #kimi #funding

LLM X/Twitter Apr 23, 2026 1 min read

Kimi K2.6、agent swarmを300体・4,000 stepへ拡張し実ファイル出力を本格化

重要なのは、Moonshotが“agent swarm”をdemo wordではなく実行スケールの数字で押し出していることだ。Kimiのpostは、1回のrunで300 sub-agentと4,000 stepを回し、chatではなく100超のfilesを返せるとした。

#moonshot #kimi #agent-swarm

LLM Hacker News Apr 22, 2026 1 min read

Kimi K2.6でHNの論点はopen-weight coding agentの持久力へ

HNはKimi K2.6を、benchmark表よりも「open-weight coding agentが長い実務を耐えられるか」という問いで読んだ。12時間、13時間のcoding事例が注目を集める一方、速度、provider品質、benchmarkの現実味もすぐに問われた。

#kimi #coding-agents #open-weights

LLM Reddit Apr 19, 2026 1 min read

145件のcoding evalで、r/LocalLLaMAはKimi K2.6とOpus 4.7を検証した

r/LocalLLaMAが反応したのはleaderboardの順位だけではなく、Opus 4.7のscoreと実使用感のズレ、Kimi K2.6のcoding agent適性だった。

#coding-agents #benchmarks #kimi

LLM Apr 17, 2026 1 min read

Cloudflare、Kimi K2.5のtoken latencyを20-30 msへ下げた

CloudflareはWorkers AI上のKimi K2.5をagent workload向けに3x fasterにしたと説明した。p90 time per tokenは約100 msから20-30 msへ下がり、peak時のinput token cache hit ratioは60%から80%へ上がった。

#cloudflare #inference #kimi

LLM Reddit Mar 18, 2026 1 min read

r/MachineLearningで注目のAttention Residuals、KimiがPreNorm residualのボトルネックに切り込む

Kimi TeamのAttnRes論文は、PreNorm residualが過去のlayer出力を固定重みで足し続けることで、深いstackで情報を薄めると主張する。解決策として、layer間のselective aggregationとコストを抑えるBlock AttnResが提示されている。

#kimi #llm-architecture #attention