#gguf

RSSフィード

LLM Reddit Apr 29, 2026 1 min read

Qwen 3.6 27B量子化比較、LocalLLaMAはQ4_K_M推しでも検証方法で議論

LocalLLaMAがまず歓迎したのは、数字そのものより「こういう比較がもっと必要だ」という空気だった。ただしQ4_K_MがQ8_0より実用的に見える結論が出ると、すぐに誤差範囲やKVキャッシュ設定を問う検証モードに入った。

#qwen #gguf #quantization

LLM Reddit Apr 28, 2026 1 min read

RTX 3090でほぼ2倍、LocalLLaMAがLuce DFlashに食いついた理由

LocalLLaMAはこれを単なるベンチ画像として流さなかった。単一のRTX 3090でQwen3.6-27Bの処理量を平均1.98倍まで押し上げ、再学習なしで長文脈も支えるという主張がスレッドの熱源になっている。

#qwen #speculative-decoding #gguf

LLM Reddit Apr 18, 2026 1 min read

Qwen3.6の熱気は、r/LocalLLaMAでGGUF運用チェックリストになった

r/LocalLLaMAが見ていたのは、Qwen3.6のrelease headlineではなく、どのGGUF quantを実機で使うべきかだった。Unslothのbenchmark postは、KLD、disk space、CUDA 13.2のgibberish問題、CUDA 13.1/13.3対応へ議論を引き寄せた。

#qwen #gguf #local-llm

LLM Reddit Apr 16, 2026 1 min read

Qwen3.5-9Bのquant選び、LocalLLaMAは雰囲気よりKLDを見たい

LocalLLaMAがこの投稿を評価したのは、複雑なGGUF選択を測れるtradeoffに変えたからだ。投稿はcommunity Qwen3.5-9B quantsをBF16 baselineに対するmean KLDで比較し、コメント欄はchart表現、Gemma 4、Thireus quants、long-context testingまで求めた。

#qwen #gguf #quantization

LLM Reddit Apr 9, 2026 1 min read

Gemma 4 GGUF を再取得すべきか、Redditが注目した llama.cpp の修正

LocalLLaMAの投稿は、最近の llama.cpp 修正により Gemma 4 GGUF を再取得する価値があると指摘し、ローカル推論利用者が見るべき変更点をまとめている。

#gemma-4 #gguf #llama-cpp

LLM Reddit Mar 23, 2026 1 min read

Qwen3.5-122B-A10B Uncensored (Aggressive) のGGUF公開、新しい K_P quants を追加

r/LocalLLaMA の投稿は、Qwen3.5-122B-A10B Uncensored (Aggressive) の GGUF release と新しい K_P quants を紹介している。0/465 refusals や zero capability loss などの数値は投稿者自身の説明であり、独立検証ではない。

#qwen #gguf #local-llms

LLM Reddit Mar 20, 2026 1 min read