#kimi

LLM Hacker News 4d ago 1 min read

Kimi K3와 Fable 조합, single model보다 routing이 강한 이유

Fireworks는 약 1,030개 agentic task에서 Kimi K3와 Fable 5를 라우팅했을 때 93% accuracy를 얻었다고 설명했다. HN의 관심은 특정 모델 승패보다, single model 선택이 점점 비효율적이라는 주장에 모였다.

#kimi #fireworks #model-routing

AI sources.Axios 6d ago 1 min read

Kimi 충격 뒤 미국 AI 정책, 중국 open-weight 모델 차단론 다시 전면으로

Kimi K3 이후 미국 정책 논의의 초점이 모델 성능 경쟁에서 접근 제한과 조달 압박으로 옮겨가고 있다. Axios는 Commerce Department의 Entity List 검토, NSA·White House Office of the National Cyber Director의 advisory 논의, 조달 규칙을 통한 압박안이 다시 힘을 얻고 있다고 보도했다.

#ai-policy #open-weight #china

LLM Hacker News Jul 18, 2026 1 min read

Kimi K3, 2.8T open model로 다시 커진 frontier 경쟁

2.8조 파라미터와 100만 토큰 context를 앞세운 Kimi K3가 HN 논쟁의 중심에 섰다. 관심은 benchmark 숫자보다 open model이 proprietary frontier와 얼마나 가까워졌는지에 모인다.

#kimi #kimi-k3 #open-models

LLM X/Twitter Jul 3, 2026 1 min read

GitHub Copilot, 첫 open-weight 선택지로 Kimi K2.7 Code 추가

Copilot 모델 선택지가 처음으로 open-weight 모델까지 넓어졌다. GitHub는 Kimi K2.7 Code를 VS Code부터 순차 제공하고, Business와 Enterprise는 관리자가 정책으로 켜야 한다고 설명했다.

#github #copilot #kimi

LLM Reddit May 12, 2026 1 min read

단종 Intel Optane으로 1조 파라미터 모델을 초당 4토큰에 구동

단종된 Intel Optane 영구 메모리를 중고 시장에서 구입해 768GB RAM 시스템을 구성하고, Kimi K2.5 1조 파라미터 모델을 로컬에서 초당 4토큰 이상으로 실행한 사례가 공개됐다.

#intel-optane #local-llm #llama-cpp

LLM May 7, 2026 1 min read

Kimi 개발사 Moonshot AI, $20B 기업가치로 $2B 조달 — 중국 AI 역대 최대

중국 AI 스타트업 Moonshot AI가 Meituan 주도로 $2B를 조달해 기업가치 $20B을 달성했다. 6개월 누적 조달액 $3.9B으로 중국 LLM 스타트업 사상 최대 투자 기록이다.

#moonshot-ai #kimi #funding

LLM X/Twitter Apr 23, 2026 1 min read

Kimi K2.6, 에이전트 스웜 300개·4,000단계로 대폭 확대…채팅 아닌 산출물로 승부

중요한 점은 Moonshot이 “agent swarm”을 데모 문구가 아니라 실행 수치로 밀고 있다는 데 있다. Kimi 포스트는 한 번의 run에서 300개 sub-agent와 4,000단계를 조정하고 채팅이 아닌 100개 이상의 파일을 돌려준다고 적었다.

#moonshot #kimi #agent-swarm

LLM Hacker News Apr 22, 2026 1 min read

Kimi K2.6, HN이 본 핵심은 open weights coding agent의 지속력

HN은 Kimi K2.6을 benchmark 표 하나보다 “open weights coding agent가 긴 작업을 버티는가”라는 질문으로 읽었다. 12시간, 13시간짜리 coding 사례와 agent swarm 주장이 관심을 끌었고, 동시에 실제 속도와 benchmark 과장 가능성도 바로 검증대에 올랐다.

#kimi #coding-agents #open-weights

LLM Reddit Apr 19, 2026 1 min read

145개 coding eval 결과에 r/LocalLLaMA가 Kimi K2.6·Opus 4.7을 따졌다

r/LocalLLaMA가 이 글에 반응한 이유는 leaderboard 숫자보다, Opus 4.7의 체감 악화와 Kimi K2.6의 실제 coding agent 운용 가능성이 충돌했기 때문이다.

#coding-agents #benchmarks #kimi

LLM Apr 17, 2026 1 min read

Cloudflare, Kimi K2.5 token latency를 20-30 ms까지 낮췄다

Cloudflare가 Workers AI에서 Kimi K2.5를 3x faster로 만들었다고 밝혔다. p90 time per token은 약 100 ms에서 20-30 ms로 내려갔고, prompt cache hit ratio는 peak 기준 60%에서 80%로 올랐다.

#cloudflare #inference #kimi

LLM Reddit Mar 18, 2026 2 min read

r/MachineLearning이 띄운 Attention Residuals, Kimi가 PreNorm residual 병목을 다시 건드리다

Kimi Team의 AttnRes 논문은 PreNorm residual이 모든 이전 layer 출력을 고정 가중치로 더하면서 깊은 stack에서 정보 희석을 만든다고 주장한다. 해결책으로 layer 간 selective aggregation과 메모리 비용을 줄인 Block AttnRes를 제시한다.

#kimi #llm-architecture #attention

LLM Reddit Feb 9, 2026 1 min read

Kimi K2.5 vs Claude Opus 4.5: 저렴한 AI 코딩 모델은 프리미엄 대체재가 될 수 있을까

한 개발자가 중국 Moonshot AI의 Kimi K2.5와 Anthropic의 Claude Opus 4.5를 실제 코딩 작업으로 비교했다. 복잡한 작업에서는 Opus가 우위를 보였지만, Kimi K2.5는 중급 난이도 작업에서 비용 대비 충분한 성능을 입증했다.

#kimi #claude #coding