LLM Reddit Mar 8, 2026 1 min read
r/LocalLLaMAでは、`llama.cpp` pull request #19504のmerge後にQwen3.5やQwen-Nextのtoken generationが改善したという報告が集まっている。PRは`GATED_DELTA_NET` opのCPU/CUDA実装を追加する。
r/LocalLLaMAでは、`llama.cpp` pull request #19504のmerge後にQwen3.5やQwen-Nextのtoken generationが改善したという報告が集まっている。PRは`GATED_DELTA_NET` opのCPU/CUDA実装を追加する。