LocalLLaMA 유저가 NVIDIA DGX Spark 16대를 200Gbps 패브릭으로 연결한 클러스터 구축을 완료했다. 통합 메모리 극대화를 목표로 DeepSeek, Kimi 등 대형 모델 서빙을 테스트 중이다.
#dgx-spark
RSS FeedNVIDIA AI PC는 2026년 4월 2일 X에서 Gemma 4 모델군이 RTX GPU와 DGX Spark에 최적화됐고, 특히 26B와 31B가 local agentic AI에 적합하다고 밝혔다. NVIDIA 공식 blog는 이 협업이 RTX PC, workstation, DGX Spark, Jetson Orin Nano, data center 배포까지 아우르며, native tool use, multimodal input, Ollama와 llama.cpp 기반 local runtime 지원을 제공한다고 설명한다.
LocalLLaMA의 DGX Spark 사용자 글은 NVFP4가 아직 production-ready와 거리가 멀다고 주장했다. 논쟁은 곧 NVIDIA의 프리미엄 로컬 AI 박스가 여전히 가격을 정당화하는지로 번졌다.
LocalLLaMA의 한 상세 벤치마크 포스트가 Qwen3.5 397B A17B를 기준으로 $10K Dual DGX Sparks와 $10K Mac Studio M3 Ultra 512GB를 비교했다. Mac은 30~40 tok/s generation과 쉬운 setup, Dual Sparks는 더 빠른 prefill과 embedding 처리 성능을 보여줬지만 운영 난이도는 훨씬 높았다.
NVIDIA가 2026년 1월 5일 CES에서 Cosmos 기반 AI foundation models와 DGX Spark·DGX Station을 공개했다. 로보틱스·자율주행용 물리 기반 합성 데이터 생성과 개인용 AI 슈퍼컴퓨팅을 동시에 밀어붙이는 전략이다.
NVIDIA가 2026년 2월 12일 공개한 사례에 따르면 DGX Spark는 대학 연구실에서 대규모 모델 실험과 로컬 추론을 빠르게 수행하는 공통 인프라로 확산되고 있다. South Pole 관측소부터 의료, 로보틱스, 생명과학 연구까지 현장형 AI 개발 속도를 높이는 데 초점이 맞춰져 있다.