NVIDIA DGX Spark 16台クラスター構築レポート — 統合メモリで大規模LLM推論

構築完了

LocalLLaMAコミュニティで注目を集めた16台NVIDIA DGX Sparkクラスターの構築が完了した。FS N8510スイッチにQSFP56ケーブルで全ノードを接続し、ノードあたり200Gbps（デュアルレールで各100〜111Gbps）のネットワーク帯域を達成している。

なぜH100やGB300ではなくDGX Sparkを選んだのか

答えは統合メモリだ。NVIDIAエコシステム内で統合メモリ容量を最大化することが最大の目的。8台構成時はGLM-5.1-NVFP4（434GB）をTP=8で提供しており、16台になった今はDeepSeekやKimiのテストとともに、プリフィル/デコード分離アーキテクチャを目指している。

セットアップ手順

各DGX SparkはNVIDIAカスタムUbuntuを搭載しており、ソフトウェアの多くが事前インストール済み。ラッキング → 電源投入 → 全ノードへの同一ユーザーアカウント作成 → ノードあたり約20分のアップデート待機 → パスワードレスSSH・ジャンボフレーム・IPの設定（スクリプト化）の順で進めた。