#local-llms

RSSフィード

LLM Reddit Apr 28, 2026 1 min read

16GB VRAMの抜け道か　LocalLLaMAが出した「古いGPUを足す」現実策

LocalLLaMAがこの投稿に反応した理由ははっきりしていた。27B modelを二枚の不揃いGPUのVRAM内へ押し込めるなら、遅い補助カードでもsystem RAMへあふれるよりましだという、かなり実務的な主張だったからだ。

#local-llms #vram #multi-gpu

LLM Hacker News Apr 28, 2026 1 min read

10時間フライトのオフラインLLM実験　HNが見たのは電力・発熱・ループの現実

Hacker Newsが反応したのは旅情ではなかった。バッテリーがほぼ1分1%で減り、筐体が膝でつらいほど熱くなり、長い文脈とagent loopがすぐ限界を見せるという現実のほうだった。

#local-llms #macbook #offline

LLM Reddit Apr 28, 2026 1 min read

ローカルコーディング38.2%、LocalLLaMAが見たのは点数より導入ライン

LocalLLaMAが熱くなった理由は絶対値の点数だけではない。2026年4月28日のこの投稿は、Qwen 3.6-27BのTerminal-Bench 2.0での38.2%をlate-2025 frontier相当と結びつけ、ローカルコーディングを導入判断の土俵に乗せた。

#qwen #terminal-bench #local-llms

LLM Reddit Apr 24, 2026 1 min read

Qwen3.6-35B結果より大きかった論点、LocalLLaMAが見たscaffold問題

LocalLLaMAを動かしたのは単なるQwenのスコア更新ではなかった。同じ系統のローカルモデルがscaffold変更だけで19%から45%、さらに78.7%へ伸びたという流れが、ベンチマーク比較そのものを見直す空気を生んだ。

#qwen #coding-agents #benchmarks

LLM Reddit Apr 17, 2026 1 min read

Ternary Bonsai、LocalLLaMAはcompression claimの比較軸を疑った

LocalLLaMAは1.58-bit modelの約束に反応したが、threadはすぐに厳しい問いへ向かった。比較相手がquantized Qwen peersではなくfull-precision baselineなら公平なのか。

#model-compression #local-llms #bonsai

LLM Hacker News Apr 17, 2026 1 min read

Qwen3.6のpelican test、HNをbenchmark論争に変えた

HNがこの冗談めいたテストに食いついたのは、鮮やかなSVG一枚が小型local modelをflagship modelより良く見せる時、それが何を意味するのか誰も簡単に決められないからだ。

#qwen #claude #local-llms

LLM Reddit Apr 14, 2026 1 min read

r/LocalLLaMAが見つけたGemma 4 long contextのprivacy-first活用

人気のr/LocalLLaMA threadは、Gemma 4の256k context windowで100k+ tokenの個人journalをローカル分析した事例を示し、privacyがon-device LLMを動かす実用的な理由になり得ることを示した。

#local-llms #gemma-4 #privacy

LLM Reddit Apr 2, 2026 1 min read

LocalLLaMA比較　Qwen3.5 397B運用でDual DGX Sparksと512GB Mac Studioが対決

LocalLLaMAの詳細ベンチマーク投稿が、Qwen3.5 397B A17Bを基準に$10KのMac Studio M3 Ultra 512GBと同価格帯のDual DGX Spark構成を比較した。Macは30 to 40 tok/sと扱いやすさ、Dual Sparksはより速いprefillとembedding性能を示したが、運用難度は大きく異なった。

#qwen3.5 #mac-studio #dgx-spark

LLM Reddit Mar 23, 2026 1 min read

Qwen3.5-122B-A10B Uncensored (Aggressive) のGGUF公開、新しい K_P quants を追加

r/LocalLLaMA の投稿は、Qwen3.5-122B-A10B Uncensored (Aggressive) の GGUF release と新しい K_P quants を紹介している。0/465 refusals や zero capability loss などの数値は投稿者自身の説明であり、独立検証ではない。

#qwen #gguf #local-llms

LLM Reddit Mar 19, 2026 1 min read

LocalLLaMAが注目したUnsloth Studio、ローカルモデル実行と学習を一画面に統合

2026年3月17日のr/LocalLLaMAにおけるUnsloth Studio投稿は、最新利用可能クロールで898 pointsと236 commentsを記録した。UnslothはStudioを、ローカル推論、データ生成、ファインチューニング、コード実行、モデル書き出しを一つにまとめるベータWeb UIとして位置づけている。

#unsloth #local-llms #llama-cpp

LLM Reddit Mar 14, 2026 1 min read

r/LocalLLaMA、共有 benchmark data が Apple Silicon local LLM 議論を測定可能にする

最近の r/LocalLLaMA で注目された投稿は、コミュニティがすでに 400 以上の model について約 1万件の Apple Silicon benchmark を提出したと述べている。重要なのは、散発的な体感談ではなく、M-series chip と context length ごとの傾向を比較できる shared dataset が立ち上がり始めた点だ。

#apple-silicon #benchmarks #omlx

LLM Reddit Mar 12, 2026 1 min read

r/LocalLLaMAが追ったllama.cppのreasoning budget制御

新しいllama.cpp変更は<code>--reasoning-budget</code>をtemplate stubではなくsampler側の実制御へ変える。LocalLLaMA threadでは、長いthink loopを削ることとanswer qualityを守ることのtradeoff、とくにlocal Qwen 3.5環境での意味が集中的に議論された。

#llama.cpp #reasoning #local-llms