Qwen3.6-35B-A3B、HNが見た焦点は3B active MoEのcoding力

HN discussionでのQwen3.6-35B-A3Bは、普通のmodel releaseよりも実務寄りに読まれていた。見出しの数字は35B total parametersだが、コミュニティが注目したのはsparse MoEという形だ。Qwenはこのモデルを35B total、約3B active parametersと説明し、Hugging FaceとModelScopeでopen weightsを出し、Qwen Studioで試せるようにして、APIではQwen3.6-Flashとして提供予定だとしている。

この形が刺さるのは、coding agentを日常の開発に入れたいチームが、frontier model級のserving costをずっと払えるわけではないからだ。Qwenの表では、Qwen3.6-35B-A3BはSWE-bench Verified 73.4、Terminal-Bench 2.0 51.5、MCPMark 37.0、QwenWebBench 1397 Eloを出している。benchmark harnessや比較対象は冷静に見る必要があるが、HNは小さいactive-parameterのMoEがsoftware作業で真面目な候補になりつつあるというシグナルとして受け止めた。

コメント欄は、open-weight modelが実際に使われるまでの道筋も見せていた。あるユーザーはすぐにUnslothのGGUF conversionを共有し、別のユーザーは36GB Macでどれだけcontextを載せられるのか、9Bや27B variantの方が欲しいのではないか、open modelだけを並べたbenchmark表だけで十分なのかを問いかけた。

重要なのは、Qwenがまたscore tableを出したことではない。HNはこのモデルをinfrastructureとして見た。quantizationできるか、local machineで動くか、memory budgetに収まるか、tool useと長いcontextが必要なcoding-agent taskで耐えられるか。いまopen modelに向けられるテストは、その現実寄りの問いになっている。

Qwen3.6-35B-A3B、HNが見た焦点は3B active MoEのcoding力

Related Articles

LocalLLaMAが注目したOmniCoder-9Bの小型coding agent路線

r/LocalLLaMAで話題、Hugging FaceにQwen3.5-35B-A3Bモデルカード

Liquid AI、38Tトークン学習のMoEモデルLFM2.5を公開

Comments (0)

Leave a Comment

Related Articles

LocalLLaMAが注目したOmniCoder-9Bの小型coding agent路線
LLM Reddit Mar 16, 2026 1 min read

r/LocalLLaMAで話題、Hugging FaceにQwen3.5-35B-A3Bモデルカード
LLM Reddit Feb 25, 2026 1 min read

Liquid AI、38Tトークン学習のMoEモデルLFM2.5を公開
Liquid AIがLFM2.5 8B-A1Bを発表。M5 Maxで毎秒253トークン、モバイルで30トークン、H100で18,500トークンの推論速度を達成し、同サイズの密なモデルを凌駕する性能を示した。