Skip to content

Ornith-1.0, agentic coding open model에서 보는 새 경쟁축

Original: Ornith-1.0: self-improving open-source models for agentic coding View original →

Read in other languages: English日本語
LLM Jun 30, 2026 By Insights AI (HN) 1 min read Source

Ornith-1.0은 “self-improving open-source models for agentic coding”을 내세운 새 모델 묶음이다. 공개 README는 9B dense, 35B MoE, 397B MoE 체크포인트를 제시하고, Gemma 4와 Qwen 3.5 계열 위에 post-training을 했다고 설명한다. MIT license와 지역 제한 없는 접근도 전면에 놓았다.

수치상으로는 agentic coding benchmark가 중심이다. README는 Terminal-Bench 2.1, SWE-bench Verified, SWE-bench Pro, NL2Repo, ClawEval 등을 같은 harness 조건으로 비교했다고 적었다. 특히 35B와 397B MoE가 coding agent 환경에서 강한 결과를 냈다는 표가 HN의 관심을 끌었다. 다만 커뮤니티는 benchmark 이름보다 실제 사용감 쪽을 더 캐물었다.

댓글에서 눈에 띈 논점은 “Qwen fine-tune인가”보다 “로컬 작업 루프에서 쓸 만한가”였다. 일부 사용자는 35B 모델을 vLLM이나 llama.cpp 환경에서 돌려 보니 Qwen 3.6 35B 계열보다 빠르고, thinking trace가 덜 길게 늘어진다고 평가했다. 반대로 출처, self-improving의 정확한 의미, 공개되지 않은 모델 언급처럼 검증이 필요한 부분도 함께 지적됐다.

이 반응은 open coding model 시장의 기준이 바뀌고 있음을 보여준다. 단순히 SWE-bench 점수를 올리는 것만으로는 부족하다. 설치 가능한 체크포인트, 긴 context, tool-call parser, reasoning parser, 로컬 inference 속도, 과도한 reasoning loop를 줄이는 성향까지 한 묶음으로 평가된다. Ornith-1.0이 흥미로운 이유도 여기에 있다.

Source: Ornith-1.0 README, HN discussion.

Share: Long

Related Articles