LocalLLaMA에서 화제가 된 LFM2.5-350M은 작은 범용 모델이 아니라 tool use와 structured output에 맞춘 350M edge model이라는 점에서 주목받았다. Liquid AI는 10T에서 28T token으로 pretraining을 늘리고 large-scale RL을 더했다고 설명한다.
#small-models
RSS Feed2026년 3월 17일 Hacker News에서 GPT-5.4 mini·nano 공개 글이 236 points와 143 comments를 모았다. OpenAI는 mini를 Codex·API·ChatGPT용 고속 coding/tool-use 모델로, nano를 classification·extraction·subagent용 저가 tier로 배치하고 있다.
OpenAI Developers는 X에서 GPT-5.4 mini와 nano가 개발자 워크플로우용 GPT-5.4 계열에 합류한다고 밝혔다. OpenAI는 mini를 API·Codex·ChatGPT용 고속 coding·tool-use 모델로, nano를 더 가벼운 API 작업용 최저가 옵션으로 포지셔닝하고 있다.
LocalLLaMA의 release post는 OmniCoder-9B를 425,000개 이상 agentic trajectory로 학습한 Qwen3.5-9B 기반 coding agent로 소개했고, 댓글은 read-before-write 같은 실제 작업 습관에 주목했다.
r/LocalLLaMA의 실험 글은 Qwen 3.5 0.8B를 MacBook Air에서 test feedback loop와 LoRA로 돌려, 13개의 self-generated repair pair만으로 holdout slice를 16/50에서 28/50으로 끌어올렸다는 tinyforge 사례를 공유했다.
r/LocalLLaMA에서 Qwen 세대별 최소 모델을 비교한 결과가 681점을 획득하며 화제가 됐습니다. Qwen 3.5의 9B 모델이 이전 세대 80B 모델을 여러 벤치마크에서 능가하고, 2B 모델이 7B급 성능을 보이는 등 세대별 개선이 놀라운 수준입니다.
Alibaba의 Qwen 팀이 Qwen 3.5 소형 모델 시리즈(0.8B~9B)를 공개했습니다. WebGPU로 브라우저에서도 실행 가능하며, 이전 세대 대비 벤치마크 성능이 대폭 향상되었습니다.