LLM Reddit Apr 29, 2026 1 min read Qwen3.6のトークン浪費を削るGBNF細工、LocalLLaMAが沸いた理由 LocalLLaMAがすぐ反応したのは、体感に直結する話だったからだ。小さなGBNF制約だけでQwen3.6のreasoning dragを減らし、長い作業のトークン浪費と時間をまとめて削ったという主張が出た。 #qwen#llama.cpp#gbnf 16