#rdma

LLM Hacker News Jun 28, 2026 1 min read

Strix Halo 2台でvLLM cluster、焦点は100GbE RDMA設定

Local LLMの関心は「動くか」から「小型のunified-memory機をどう一台のように束ねるか」へ移っている。このguideはFramework Strix Halo、Intel E810 RoCE v2、vLLM servingをつなぐ。

LLM Reddit Feb 26, 2026 1 min read

r/LocalLLaMAで話題になったDualPath論文は、KV-Cacheの読み込み経路を二重化して推論スループットを改善する手法を提示した。arXiv要約では、オフライン最大1.87倍、オンライン平均1.96倍の改善が報告されている。