#nvfp4

AI Reddit Apr 5, 2026 1 min read

LocalLLaMA 경고: DGX Spark의 NVFP4는 아직 production-ready 단계가 아니라는 지적

LocalLLaMA의 DGX Spark 사용자 글은 NVFP4가 아직 production-ready와 거리가 멀다고 주장했다. 논쟁은 곧 NVIDIA의 프리미엄 로컬 AI 박스가 여전히 가격을 정당화하는지로 번졌다.

#ai-hardware #nvidia #dgx-spark

LLM Hacker News Apr 1, 2026 1 min read

Ollama, Apple Silicon용 MLX 기반 미리보기 공개

3월 31일 Hacker News 상위권에 오른 Ollama의 MLX 발표는 Apple Silicon에서 로컬 coding agent 성능을 높이려는 시도다. MLX, NVFP4, 그리고 개선된 cache 전략을 묶어 macOS 로컬 추론 병목을 줄이겠다는 내용이 핵심이다.

#ollama #mlx #apple-silicon

LLM Reddit Mar 6, 2026 1 min read

llama.cpp NVFP4 양자화 PR, LocalLLaMA에서 로컬 추론 핵심 이슈로 부상

r/LocalLLaMA에서 llama.cpp GGUF의 NVFP4 지원 PR이 큰 반응을 얻었다. 제한된 VRAM 환경에서 메모리 효율과 추론 속도 개선 가능성이 주된 관심사다.

#llama-cpp #gguf #nvfp4