#coding-agents

LLM 23h ago 2 min read

Claude Opus 5, Fable급 코딩 성능을 절반 가격대로 낮춘 일상형 고성능 모델

일상형 고성능 모델 경쟁의 초점이 최고점보다 비용당 성능으로 옮겨갔다. Claude Opus 5는 Fable 5에 가까운 코딩·지식 작업 성능을 절반 가격으로 내세우며, API 가격은 입력 $5/M·출력 $25/M 토큰으로 책정됐다.

#anthropic #claude #coding-agents

LLM Hacker News 1d ago 1 min read

Software factory 논쟁, harness보다 review 병목이 먼저인 이유

AI coding agent를 더 많이 돌리자는 흐름에 맞서, 문제는 loop 수가 아니라 검토와 모델 학습의 한계라는 반론이 힘을 얻었다.

#coding-agents #software-factory #code-review

LLM X/Twitter Jul 19, 2026 1 min read

OpenInterpreter, Rust 기반 Kimi K3 하네스로 공개 모델 코딩 에이전트 강화

공개 모델용 코딩 에이전트가 특정 모델 하네스와 SDK 호환성을 앞세워 성숙하고 있다. OpenInterpreter는 Rust로 구현한 Kimi K3 네이티브 하네스, Apache 라이선스, ACP와 Codex SDK 호환을 내세웠다.

#openinterpreter #kimi-k3 #rust

LLM Hacker News Jul 18, 2026 1 min read

LM Studio Bionic, local model agent가 노리는 데스크톱 작업대

LM Studio Bionic은 open model을 쓰는 agent workflow를 데스크톱으로 끌어오려는 시도다. HN의 관심은 coding 기능과 함께 local 실행, cloud 전환, closed-source 앱이라는 긴장에 모였다.

#lm-studio #open-models #coding-agents

LLM Hacker News Jul 18, 2026 1 min read

Grok Build 공개, coding agent가 privacy fork까지 부른 이유

xAI의 terminal coding agent가 공개되자 HN의 관심은 기능보다 신뢰와 통제권으로 향했다. Rust TUI, shell 실행, ACP 지원보다 더 뜨거운 쟁점은 telemetry와 fork 가능성이었다.

#grok #xai #coding-agents

LLM Hacker News Jul 14, 2026 1 min read

Clawk, 코딩 에이전트에게 내 노트북 대신 버리는 Linux VM

코딩 에이전트가 실제 명령을 실행해야 유용하지만, 로컬 머신을 그대로 맡기는 불안도 커졌다. Clawk는 권한 프롬프트 대신 일회용 VM과 네트워크 allow-list로 경계를 세우는 접근을 제안한다.

#coding-agents #sandboxing #vm

LLM X/Twitter Jul 10, 2026 1 min read

SWE-Bench Pro 30% 결함, OpenAI가 coding benchmark 권고 철회

OpenAI가 SWE-Bench Pro 공개 과제의 30%가 깨져 frontier coding 역량을 안정적으로 재지 못한다고 밝혔다. 숨은 요구사항, 충돌하는 지시, 과도한 테스트가 정답을 실패로 처리할 수 있다는 지적이다.

#openai #swe-bench #coding-agents

LLM Hacker News Jul 6, 2026 1 min read

깨끗한 코드가 coding agent 비용을 줄이는 이유

Pass rate보다 token과 탐색 비용이 논점이다. HN 토론은 “성공률은 같아도 작업 흔적은 달라진다”는 지점을 파고들었다.

#coding-agents #software-engineering #maintainability

LLM X/Twitter Jul 6, 2026 1 min read

Databricks Omnigent, 여러 coding agent를 한 workflow로 조율

AI coding이 단일 assistant 경쟁에서 orchestration 문제로 넘어가고 있다. Omnigent는 여러 coding agent를 같은 세션에서 조율하고 guardrails와 human-in-the-loop 절차를 묶는 open-source meta-harness다.

#databricks #coding-agents #open-source

LLM X/Twitter Jul 3, 2026 1 min read

GitHub Copilot, 첫 open-weight 선택지로 Kimi K2.7 Code 추가

Copilot 모델 선택지가 처음으로 open-weight 모델까지 넓어졌다. GitHub는 Kimi K2.7 Code를 VS Code부터 순차 제공하고, Business와 Enterprise는 관리자가 정책으로 켜야 한다고 설명했다.

#github #copilot #kimi

LLM Hacker News Jun 30, 2026 1 min read

Ornith-1.0, agentic coding open model에서 보는 새 경쟁축

벤치마크 숫자보다 HN 댓글이 파고든 지점은 작은 모델을 실제 코딩 루프에 넣었을 때의 속도와 안정성이다.

#ornith #coding-agents #open-models

LLM Hacker News Jun 30, 2026 1 min read

GLM 5.2, Semgrep 보안 benchmark에서 Claude 추월

오픈 weight 모델이 실제 보안 버그 탐지 과제에서 Claude Code를 앞섰다는 점에 관심이 모였다.

#glm #security #benchmark