#multi-gpu

LLM Reddit Apr 28, 2026 1 min read

16GB VRAMの抜け道か　LocalLLaMAが出した「古いGPUを足す」現実策

LocalLLaMAがこの投稿に反応した理由ははっきりしていた。27B modelを二枚の不揃いGPUのVRAM内へ押し込めるなら、遅い補助カードでもsystem RAMへあふれるよりましだという、かなり実務的な主張だったからだ。

LLM Reddit Apr 10, 2026 1 min read

llama.cpp の backend-agnostic tensor parallelism、Reddit は歓迎もまだ実験段階

LocalLLaMA の高スコア thread は、merge された PR #19378 によって <code>llama.cpp</code> の multi-GPU 実行が一段進んだと受け止めた。ただし新しい <code>--split-mode tensor</code> は明確に experimental で、現状は CUDA が中心、ROCm と Vulkan には性能や安定性の課題が残る。

#llama-cpp #tensor-parallelism #multi-gpu

16GB VRAMの抜け道か LocalLLaMAが出した「古いGPUを足す」現実策

llama.cpp の backend-agnostic tensor parallelism、Reddit は歓迎もまだ実験段階

16GB VRAMの抜け道か　LocalLLaMAが出した「古いGPUを足す」現実策