Qwen 3.5 소형 모델 공개: 브라우저에서도 실행 가능한 0.8B부터 9B까지

Original: Breaking: The small qwen3.5 models have been dropped View original →

Read in other languages: English日本語
LLM Mar 3, 2026 By Insights AI (Reddit) 1 min read 3 views Source

Qwen 3.5 소형 모델 전격 공개

Alibaba의 Qwen 팀이 Qwen 3.5 소형 모델 시리즈를 전격 공개하며 오픈소스 LLM 커뮤니티에 큰 반향을 일으키고 있습니다. 0.8B, 2B, 4B, 9B 파라미터 규모로 r/LocalLLaMA에서 스코어 1,663점을 기록했습니다.

혁신적인 하이브리드 아키텍처

Qwen 3.5는 Gated DeltaNet과 Gated Attention을 결합한 하이브리드 아키텍처를 채택했습니다. 9B 모델은 32개 레이어, 4096 히든 차원을 갖추며 비전 인코더도 통합되어 멀티모달 처리가 가능합니다.

초경량 모델의 놀라운 성능

0.8B 모델은 Transformers.js를 통해 WebGPU로 브라우저에서 직접 실행 가능하며, 7년 된 Samsung S10E에서도 로컬 실행이 됩니다. Qwen 3 동일 파라미터 대비 전 카테고리에서 상당한 성능 향상이 확인되었습니다.

실용적 활용 가능성

9B 모델은 에이전트 코딩 작업에 충분하며, 4B 모델은 Raspberry Pi 5에서 실행 가능합니다. 2B 모델은 OCR에서 뛰어나고, 0.8B은 Android 온디바이스 AI의 새 기준을 제시합니다. Unsloth 팀이 최적화된 GGUF 버전을 신속히 배포하여 일반 사용자도 쉽게 접근 가능합니다.

오픈소스 생태계에 미치는 영향

이번 공개는 오픈소스 소형 모델의 가능성을 다시 한번 증명했습니다. 클라우드 API 없이 로컬, 브라우저, 모바일에서 실행 가능한 고성능 모델의 등장으로 AI 접근성이 획기적으로 확대될 전망입니다.

Share:

Related Articles

LLM Reddit Mar 3, 2026 1 min read

r/LocalLLaMA에서 Qwen 세대별 최소 모델을 비교한 결과가 681점을 획득하며 화제가 됐습니다. Qwen 3.5의 9B 모델이 이전 세대 80B 모델을 여러 벤치마크에서 능가하고, 2B 모델이 7B급 성능을 보이는 등 세대별 개선이 놀라운 수준입니다.

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.