#host-memory - Insights

LLM Hacker News Apr 8, 2026 1 min read

MegaTrain、単一GPUで100B+パラメータLLMのfull precision学習を狙うHN注目論文

MegaTrainはparametersとoptimizer statesをhost memoryに置き、layerをGPUへstreamすることで、100B+ parameter LLMのfull precision学習を単一GPUで行うことを目指す。Hacker Newsで注目された理由は、問題をGPU台数ではなくmemory system設計として捉え直している点にある。

#llm-training #systems #gpu