#local-llm

RSS Feed

LLM Reddit 1d ago 1 min read

Qwen3.6-27BがSonnet級へ? LocalLLaMAがすぐ測り方を問い直した

27BモデルがSonnet 4.6に並んだという話でLocalLLaMAは沸いたが、議論はすぐベンチ最適化と実運用条件の確認に移った。

#qwen #local-llm #benchmarks

LLM Reddit 4d ago 1 min read

MacBook Air M5でlocal coding LLM 21個比較、LocalLLaMAが欲しかった実測値

r/LocalLLaMAのMacBook Air M5 benchmarkは、Qwen 3.6 35B-A3Bの89.6% HumanEval+だけでなく、RAMとtok/sを一緒に見る実用的な視点を出した。

#localllama #benchmark #qwen

LLM Reddit 4d ago 1 min read

LocalLLaMAのGemma 4翻訳例、「自分で動かす」価値に反応

r/LocalLLaMAの投稿は正式なbenchmarkではないが、hosted modelがupdateやfilterで揺れる中、local modelのcontrolが価値になるというcommunity moodをよく表している。

#localllama #gemma #local-llm

LLM Reddit 4d ago 1 min read

Qwen3.6-27BでLocalLLaMA沸く、27B denseと262K context

LocalLLaMAはQwen3.6-27Bを単なるmodel cardではなく、すぐquantizeして手元で試せるownershipの話として受け止めた。

#qwen #local-llm #open-weights

LLM Reddit 4d ago 1 min read

Rust製manga translator、LocalLLaMAが見たlocal OCR pipelineの手触り

LocalLLaMAが反応したのは翻訳appそのものではなく、detection、visual OCR、inpainting、local LLMを一つのworkflowにした点だった。

#llama-cpp #ocr #local-llm

LLM Reddit 4d ago 1 min read

llama.cpp --fitでLocalLLaMAがVRAMの壁を再計算

LocalLLaMAが反応したのは新model自慢ではなく、--fitが「VRAMに全部入らなければ遅い」という経験則を揺らしたからだ。

#llama-cpp #local-llm #vram

LLM Reddit Apr 20, 2026 1 min read

Qwen3.6でLocalLLaMAが沸いた理由は、benchmarkではなくagentの自己修正だった

r/LocalLLaMAが900 points超まで反応した理由はscore表ではない。local coding agentがcanvas bugとwave completion issueを見つけて直したという使用感だった。

#qwen #local-llm #agents

LLM Reddit Apr 20, 2026 1 min read

M5 Maxで動くQwen3.6に、LocalLLaMAはcodeを外へ出さない現実味を見た

r/LocalLLaMAがこの投稿を押し上げたのは、“trust me bro”な体験談の中に8-bit、64k context、OpenCode、Android debuggingという実使用条件が入っていたからだ。

#qwen #local-llm #coding-agents

LLM Reddit Apr 20, 2026 1 min read

llama.cpp speculative checkpointing、LocalLLaMAはparameter探しに向かった

LocalLLaMAがこのmergeに反応したのは、すぐ試せるからだ。ただしthreadの有益なcaveatは、speedupがpromptの反復性とdraft acceptanceに大きく依存する点だった。

#llama.cpp #inference #local-llm

LLM Reddit Apr 19, 2026 1 min read

LocalLLaMAのQwen 3.6熱、焦点は性能より設定

LocalLLaMAで伸びた理由は、単なる「新モデルが強い」という話ではなかった。投稿者はM5 Max 128GB環境で、普段ならOpusやCodexに任せるworkloadをQwen 3.6で試したとし、実用上のポイントとしてpreserve_thinkingを有効にする必要を挙げた。

#qwen #local-llm #configuration

LLM Reddit Apr 19, 2026 1 min read

Local tool callingの現実チェック、r/LocalLLaMAはmodelよりharnessを疑った

r/LocalLLaMAのthreadはlocal tool calling失敗談を、OpenWebUI、native tool calls、quant、runtime、wrapperのチェックリストへ変えた。

#local-llm #tool-calling #qwen

LLM Reddit Apr 19, 2026 1 min read

Qwen3.6を79 t/sにした投稿で、LocalLLaMAの主役は--n-cpu-moeになった

r/LocalLLaMAが反応したのは具体的な数字だ。RTX 5070 Tiで128K context、79 t/s、その鍵がllama.cppのflagに絞られた。

#qwen #llama-cpp #local-llm