Skip to content

#tensor-parallelism

RSS Feed
LLM Reddit Apr 10, 2026 1 min read

LocalLLaMA の高スコア thread は、merge された PR #19378 によって <code>llama.cpp</code> の multi-GPU 実行が一段進んだと受け止めた。ただし新しい <code>--split-mode tensor</code> は明確に experimental で、現状は CUDA が中心、ROCm と Vulkan には性能や安定性の課題が残る。