LLM Reddit Apr 9, 2026 1 min read
r/LocalLLaMAのdebugging postは、Qwen 3.5のchat template問題がtool-heavy turn後のprefix-cache reuseを壊し、大きな無駄計算を生んでいる可能性があると主張している。
r/LocalLLaMAのdebugging postは、Qwen 3.5のchat template問題がtool-heavy turn後のprefix-cache reuseを壊し、大きな無駄計算を生んでいる可能性があると主張している。