#open-source

LLM Hacker News Feb 22, 2026 1 min read

CPU RAMを完全にバイパスし、NVMe SSDからGPUへ直接ウェイトをストリーミングすることで、単体の消費者向けGPU(RTX 3090)でLlama 3.1 70Bを動作させるオープンソースプロジェクト「ntransformer」が公開されました。

© 2026 Insights. All rights reserved.