#local-llm

RSSフィード

LLM Reddit 2d ago 1 min read

Open-weight規制反対の公開書簡、LocalLLaMAで焦点になった署名企業

Microsoft主導の書簡は、open-weight modelを守る主張だけでなく、署名した企業と不在の企業によって議論を呼んだ。

#open-weights #ai-policy #local-llm

2

LLM Reddit Jul 4, 2026 1 min read

GLM5.2を自宅で動かす現実、LocalLLaMAが見たGPU請求書

RTX PRO 6000を5枚と5090を使った構成は、ローカルLLMの魅力と同時に電力、VRAM、予算の重さを示した。

#glm #local-llm #gpu

10

LLM Reddit Jun 30, 2026 1 min read

OpenPangu-2.0-Flash公開、92B total・6B active MoEにLocalLLaMAが注目

議論の中心は、6B activeのMoEがどこまでlocal運用に近づくかだった。

#openpangu #huawei #moe

10

LLM Hacker News Jun 30, 2026 1 min read

Qwen 3.6 27B、local開発モデルの現実的なsweet spotか

開発者の関心は、localモデルが日常作業にどこまで使えるかに向かった。

#qwen #local-llm #developer-tools

12

LLM Hacker News Jun 20, 2026 1 min read

Local QwenはOpusの劣化版ではなく、別の運用モデル

Alex Ellisの記事は、local LLMをベンチマーク順位ではなく、事業でのコスト、制御、agent運用の信頼性から捉えた点で読まれた。

#qwen #local-llm #coding-agents

13

LLM Reddit Jun 18, 2026 1 min read

ローカルLLMに空いた80-160Bの中間層、unified memory勢の現実的な要望

LocalLLaMAの議論は、巨大モデルへの憧れではなく、96-128GB級メモリを持つユーザーが使える新しい中間モデルの不足を指している。

#localllama #local-llm #unified-memory

15

LLM Reddit Jun 16, 2026 1 min read

vLLMのQwen3+ streaming parser、local agent運用の痛点へ

LocalLLaMAで注目されたのは、小さく見えるvLLM nightlyのparser修正だ。Qwen3.6-27Bのmid-turn停止やstreaming tool call失敗は、local agent loopでは実害が大きい。

#vllm #qwen #tool-calling

19

LLM Hacker News Jun 16, 2026 1 min read

ローカルモデル、趣味の実行環境からcoding workflowへ

HNの論点は、local LLMがfrontier modelを完全に置き換えるかではなかった。Gemma、Qwen、agentic coding、メモリ制約、コスト、privacyをどう組み合わせるかに議論が集まった。

#local-llm #agentic-coding #gemma

16

LLM Reddit Jun 14, 2026 1 min read

Xiaomi MiMoの1Tモデル1000tps主張、LocalLLaMAの焦点は再現性

LocalLLaMAで注目されたのは速度の数字だけでなく、FP4、DFlash、commodity GPU向けkernelが外部でも検証できるかだった。

#xiaomi #mimo #inference

20

LLM Reddit May 24, 2026 1 min read

Chrome内の小さなGemini Nano、LocalLLaMAが実行条件を検証

反応は「ブラウザだけでローカルLLM」という手軽さと、WebGPU、モデルの正体、制限条件への補足に分かれた。

#local-llm #chrome #gemini-nano

19

LLM Reddit May 22, 2026 1 min read

Qwen3.6 35BがスキルベースプロンプティングでワークフローCreate

LocalLLaMAで話題になったポストで、Qwen3.6 35B A3BがCodexとpiエージェントを組み合わせたスキルベースプロンプティングにより、VPS管理やPDF変換などの複雑なワークフローを自動化した体験が共有されました。

#qwen #local-llm #workflow

20

LLM Reddit May 22, 2026 1 min read

12GB VRAMでQwen3.6 35BをIk_llama.cppで110 tok/s達成

LocalLLaMAコミュニティユーザーがRTX 4070 Super 12GBでQwen3.6 35B A3BモデルをIk_llama.cppフォークを使用して110トークン/秒で実行することに成功しました。CPU オフロード最適化に優れたこのフォークは標準llama.cppより大幅に高いパフォーマンスを示しました。

#llama-cpp #qwen #local-llm

24