Qwen3.6-35B-A3B、HNが見た焦点は3B active MoEのcoding力
Original: Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All View original →
HN discussionでのQwen3.6-35B-A3Bは、普通のmodel releaseよりも実務寄りに読まれていた。見出しの数字は35B total parametersだが、コミュニティが注目したのはsparse MoEという形だ。Qwenはこのモデルを35B total、約3B active parametersと説明し、Hugging FaceとModelScopeでopen weightsを出し、Qwen Studioで試せるようにして、APIではQwen3.6-Flashとして提供予定だとしている。
この形が刺さるのは、coding agentを日常の開発に入れたいチームが、frontier model級のserving costをずっと払えるわけではないからだ。Qwenの表では、Qwen3.6-35B-A3BはSWE-bench Verified 73.4、Terminal-Bench 2.0 51.5、MCPMark 37.0、QwenWebBench 1397 Eloを出している。benchmark harnessや比較対象は冷静に見る必要があるが、HNは小さいactive-parameterのMoEがsoftware作業で真面目な候補になりつつあるというシグナルとして受け止めた。
コメント欄は、open-weight modelが実際に使われるまでの道筋も見せていた。あるユーザーはすぐにUnslothのGGUF conversionを共有し、別のユーザーは36GB Macでどれだけcontextを載せられるのか、9Bや27B variantの方が欲しいのではないか、open modelだけを並べたbenchmark表だけで十分なのかを問いかけた。
重要なのは、Qwenがまたscore tableを出したことではない。HNはこのモデルをinfrastructureとして見た。quantizationできるか、local machineで動くか、memory budgetに収まるか、tool useと長いcontextが必要なcoding-agent taskで耐えられるか。いまopen modelに向けられるテストは、その現実寄りの問いになっている。
Related Articles
LocalLLaMA の release post は OmniCoder-9B を 425,000超の agentic trajectory で学習した Qwen3.5-9B ベースの coding agent として紹介し、コメント欄では read-before-write のような実務的な挙動が注目された。
LocalLLaMAでQwen3.5-35B-A3Bのモデルカード共有が急拡大した。MoE構成、長いcontext、主要推論スタック対応が実運用観点で注目されている。
Liquid AIがLFM2.5 8B-A1Bを発表。M5 Maxで毎秒253トークン、モバイルで30トークン、H100で18,500トークンの推論速度を達成し、同サイズの密なモデルを凌駕する性能を示した。
Comments (0)
No comments yet. Be the first to comment!