Qwen 3.5 小型モデル公開：ブラウザでも動く0.8Bから9Bまで

Qwen 3.5 小型モデルが登場

AlibabaのQwenチームがQwen 3.5小型モデルシリーズを公開し、r/LocalLLaMAで1,663スコアという驚異的な反響を獲得しました。0.8B、2B、4B、9Bの4種類のパラメータ規模が提供されています。

革新的なハイブリッドアーキテクチャ

Qwen 3.5はGated DeltaNetと標準的なGated Attentionを組み合わせたハイブリッドアーキテクチャを採用しています。9Bモデルは32層・4096次元のhidden dimensionを持ち、ビジョンエンコーダも統合したマルチモーダル処理が可能です。

小型モデルの驚くべき性能

0.8BモデルはTransformers.jsを通じてWebGPUでブラウザ内直接実行が可能で、7年前のSamsung S10EなどのAndroidデバイスでもローカル動作します。コミュニティベンチマークでは同パラメータ数のQwen 3と比べて全カテゴリで顕著な性能向上が確認されています。

多様なデプロイ環境への対応

9BはAgentic Codingタスクで十分な性能を発揮し、4BはRaspberry Pi 5でも動作します。2BはOCR処理に優れ、0.8BはAndroidでのオンデバイスAIの新基準を打ち立てました。UnslothチームはGGUF最適化版を迅速にリリースし、llama.cppなどで広く利用可能になっています。