13ヶ月の驚くべき比較:2025年初頭にはDeepSeek R1をフロンティアレベルで約5 t/s実行するのに$6,000が必要だったが、今では$600のミニPCでさらに優れたモデルを同じ速度で、もしくは17-20 t/sで実行できる。
#qwen
RSS FeedAlibabaのQwenチームがQwen 3.5 Smallをリリースした。r/LocalLLaMAで1,000以上のアップボートを記録したこの発表は、高性能小型モデルへのコミュニティの高い関心を反映している。
r/LocalLLaMAコミュニティで、Qwen 3.5-35B-A3BがGPT-OSS-120Bよりも優れた性能を示しながら、サイズは1/3に過ぎないとする投稿が高評価を得ています。
r/LocalLLaMAの高反応投稿で、UnslothのQwen3.5-35B-A3B Dynamic GGUF更新が共有され、KLD/PPL指標と下流評価の両立が議論された。
高反応を得たLocalLLaMAの追試投稿では、Qwen3.5-35B-A3BをRTX 5080環境で運用する際、Q4_K_M・KV q8_0・バッチ指定なしの--fit構成が実用面で有利と報告された。
r/LocalLLaMAではQwen3.5-122B-A10B公開直後から、GGUF提供時期、量子化方式、実運用スループットの議論が加速した。モデルカードでは122B total/10B activatedのMoE構成、Apache-2.0、262,144トークンの標準contextが示されている。
r/LocalLLaMAで、Qwen3.5-35B-A3Bを単一RTX 3090で運用したagentic coding検証が大きな反響を得た。投稿者は100+ tokens/sと実務的なコーディング課題の通過を報告したが、コメントではツール利用の安定性や量子化設定による再現差も指摘されている。
LocalLLaMAでQwen3.5-35B-A3Bのモデルカード共有が急拡大した。MoE構成、長いcontext、主要推論スタック対応が実運用観点で注目されている。
r/LocalLLaMAコミュニティで、AlibabのQwen公式チャットインターフェースにQwen3.5モデル名が表示されているとの報告が話題に。次世代オープンソースLLMシリーズのリリースが間近に迫っていることを示唆している。
Qwen研究チームが発表した論文により、GPQAとHLE(Humanity's Last Exam)ベンチマークデータセットに深刻な品質問題が存在することが公式に確認されました。OCRエラー、誤った正解ラベル、検証不可能な問題が含まれており、現在のAIモデル評価の信頼性に疑問が呈されています。
Alibabaは2月16日にQwen 3.5をApache 2.0で公開した。3970億パラメータ(アクティブ170億)のスパースMoEアーキテクチャ、256Kコンテキスト、ネイティブマルチモーダル対応を備え、GPT-5.2と同等のベンチマーク性能を主張する。
r/LocalLLaMAのQwen3.5投稿は123ポイント・13コメントで拡散し、公開ウェイトの即時検証ニーズを再確認させました。リンク先モデルカードでは397B total、17B activated、262,144 native contextなどの主要仕様が明示されています。