LLM

LLM 17h ago 1 min read

MCP, 세션 지우고 HTTP 인프라 위로… 2026-07-28 spec 확정

MCP 2026-07-28 spec이 세션 기반 연결을 걷어내고 stateless core, MRTR, header routing을 정식으로 도입했다. TypeScript와 Python SDK가 각각 누적 10억 다운로드를 넘은 시점이라, agent tool 서버의 배포 방식이 바로 바뀐다.

#mcp #agents #protocol

LLM X/Twitter 21h ago 1 min read

Claude Mythos가 HAWK 키 강도 절반과 AES 공격 200-800배 개선을 포착한 이유

Claude Mythos Preview가 HAWK 후보 서명 체계의 유효 키 강도를 절반으로 낮추고 7라운드 AES 공격을 200-800배 빠르게 만든 방법을 찾았다. 실제 운영 시스템은 영향받지 않지만, 암호 표준 검증에 LLM이 들어오기 시작했다는 신호다.

#anthropic #claude-mythos #cryptography

LLM Hacker News 1d ago 1 min read

Kimi-K3 공개, 3T open-weight 모델의 비용 논점

Kimi-K3는 단순한 모델 공개보다 운영비와 커스터마이징 가능성 때문에 HN 논의가 커졌다.

#kimi #open-weights #huggingface

LLM X/Twitter 1d ago 1 min read

Anthropic, 오픈 가중치 금지 대신 칩 통제·증류 단속·안전 테스트 체계 요구로 선회

Anthropic이 오픈 가중치 모델 전면 금지론과 거리를 두고, 강력한 칩 통제·산업적 증류 단속·충분히 강한 모든 모델의 안전 테스트를 제시했다. 관련 트윗은 447만 조회를 넘겼다.

#anthropic #open-weights #ai-policy

LLM X/Twitter 1d ago 1 min read

Kimi K3, 2.8T 오픈 가중치와 1M 컨텍스트로 열린 모델 인프라 경쟁 재점화 신호

2.8T MoE와 1M 토큰 컨텍스트를 가진 Kimi K3 가중치가 공개되며 오픈 모델의 기준선이 다시 올라갔다. Moonshot은 104B 활성 파라미터와 896개 전문가 구조, 2.5배 효율 개선을 함께 제시했다.

#kimi #moonshot-ai #open-weights

LLM X/Twitter 2d ago 1 min read

Nemotron 3 Ultra, RTL 코딩 9개 범주 평균 97.1% 통과율로 열린 모델 경쟁 압박

반도체 설계 자동화에서 열린 모델의 실전성이 더 구체적인 수치로 제시됐다. NVIDIA는 Nemotron 3 Ultra가 CVDP 9개 RTL 범주에서 평균 97.1% 통과율과 반복당 6,629 토큰을 기록했다고 전했다.

#nvidia #nemotron #rtl

LLM X/Twitter 2d ago 1 min read

NVIDIA의 NOOA 공개, SWE-bench 82.2%와 CyberGym 86.8%가 가리키는 새 에이전트 기준

에이전트 성능 경쟁이 모델 크기만의 문제가 아니라는 점이 숫자로 드러났다. NVIDIA는 NOOA가 SWE-bench Verified 82.2%, CyberGym L1 86.8%를 기록했다고 밝혔다.

#nvidia #agents #nooa

LLM Hacker News 3d ago 1 min read

ESP32에서 28.9M LLM, 8달러 칩 위의 온디바이스 실험

작은 microcontroller에서 LLM을 돌린다는 말은 과장이 아니다. 핵심은 flash에 25M parameter lookup table을 두고 token마다 필요한 일부만 읽는 메모리 배치다.

#esp32 #edge-ai #llm

LLM Hacker News 3d ago 1 min read

Debian LLM 사용 투표, 금지와 조건부 허용 사이

#debian #open-source #llm-policy

LLM Hacker News 3d ago 1 min read

Open-weight AI의 Kubernetes 순간, 금지보다 생태계가 논점

오픈 가중치 모델을 둘러싼 관심은 “중국 모델을 막을 수 있나”보다 더 넓다. 모델 자체보다 그 위에 쌓이는 agent runtime, serving, 평가, 운영 도구가 다음 경쟁장이 되고 있다.

#open-weight #ai-policy #kubernetes

LLM 3d ago 1 min read

GitHub Copilot에 Claude Opus 5 투입, 장시간 코딩 agent 선택지 확대

Claude Opus 5가 GitHub Copilot 모델 선택지에 들어오면서 고난도 코딩 작업을 GitHub 작업면 안에서 바로 맡길 수 있게 됐다. Pro+, Max, Business, Enterprise 사용자는 VS Code, Copilot CLI, cloud agent, JetBrains 등 9개 표면에서 순차적으로 접근한다.

#github-copilot #claude-opus-5 #coding-agents

LLM 4d ago 2 min read

Claude Opus 5, Fable급 코딩 성능을 절반 가격대로 낮춘 일상형 고성능 모델

일상형 고성능 모델 경쟁의 초점이 최고점보다 비용당 성능으로 옮겨갔다. Claude Opus 5는 Fable 5에 가까운 코딩·지식 작업 성능을 절반 가격으로 내세우며, API 가격은 입력 $5/M·출력 $25/M 토큰으로 책정됐다.

#anthropic #claude #coding-agents