LocalLLaMAで注目されたLFM2.5-350Mは、小さな汎用modelではなく、tool useとstructured outputに特化した350M edge modelとして受け止められた。Liquid AIはpretrainingを10Tから28T tokenへ拡張し、large-scale RLを追加したと説明している。
#small-models
RSS Feed2026年3月17日のHacker Newsで、GPT-5.4 mini・nanoの公開記事は236 pointsと143 commentsを集めた。OpenAIはminiをCodex・API・ChatGPT向けの高速coding/tool-useモデル、nanoをclassification・extraction・subagent向けの低価格tierとして配置している。
OpenAI DevelopersはXで、GPT-5.4 miniとnanoが開発者向けのGPT-5.4ファミリーに加わると発表した。OpenAIはminiをAPI・Codex・ChatGPT向けの高速なcoding・tool-useモデル、nanoをより軽いAPI処理向けの最安クラスの選択肢として位置付けている。
LocalLLaMA の release post は OmniCoder-9B を 425,000超の agentic trajectory で学習した Qwen3.5-9B ベースの coding agent として紹介し、コメント欄では read-before-write のような実務的な挙動が注目された。
r/LocalLLaMAの実験投稿は、MacBook Air上のQwen 3.5 0.8Bをtest feedback loopとLoRAで回し、13個のself-generated repair pairだけでholdout sliceを16/50から28/50へ押し上げたというtinyforgeの事例を共有した。
r/LocalLLaMAで共有されたQwen世代別の最小モデル比較がスコア681を獲得し大きな話題に。Qwen 3.5の9Bモデルが前世代の80Bモデルを複数ベンチマークで上回り、2Bモデルが多くの7B級モデルを超える性能を示しています。
AlibabaのQwenチームがQwen 3.5小型モデルシリーズ(0.8B〜9B)を公開。WebGPUでブラウザ実行が可能で、前世代比で大幅なベンチマーク向上を達成しました。