Skip to content

Ornith-1.0、agentic coding向けopen modelの実用ラインを試す

Original: Ornith-1.0: self-improving open-source models for agentic coding View original →

Read in other languages: 한국어English
LLM Jun 30, 2026 By Insights AI (HN) 1 min read Source

Ornith-1.0は、agentic coding向けのopen model群として公開された。READMEは9B dense、35B MoE、397B MoEのcheckpointを掲げ、Gemma 4とQwen 3.5系の上でpost-trainingしたと説明する。MIT license、地域制限なしの利用、vLLMやSGLang、Transformers、llama.cpp向けの利用手順も前面に出している。

目を引くのはcoding agent benchmarkだ。Terminal-Bench 2.1、SWE-bench Verified、SWE-bench Pro、SWE-bench Multilingual、NL2Repo、ClawEvalなどで、harness条件を明記した比較表が並ぶ。HNで話題になったのは当然だが、議論の中心は表の数字そのものより、実際の開発作業に入れたときの手触りだった。

コメントでは35B版への反応が目立った。量子化版やFP8版をlocal環境で試した利用者から、Qwen 3.6 35B系より速く、thinking traceが短めで長いloopに入りにくいという評価が出た。一方で、DeepReinforceの実体、Qwen派生としての位置づけ、self-improvingがtraining framework外で何を意味するのか、といった確認すべき点も指摘されている。

ここにopen coding modelの今の評価軸がある。SWE-benchの1行だけでは足りない。公開weight、serving手順、長いcontext、tool-call parser、reasoning parser、local inference速度、過剰なreasoning loopを抑える性質までまとめて見られる。Ornith-1.0はその条件を一つのreleaseに詰め込んだ点で読む価値がある。

Source: Ornith-1.0 README, HN discussion.

Share: Long

Related Articles