LLM Reddit Feb 28, 2026 1 min read r/LocalLLaMA追試: RTX 5080 16GBではQ4_K_M + fit-nobatch構成が有力 高反応を得たLocalLLaMAの追試投稿では、Qwen3.5-35B-A3BをRTX 5080環境で運用する際、Q4_K_M・KV q8_0・バッチ指定なしの--fit構成が実用面で有利と報告された。 #qwen#llama-cpp#quantization 10