LocalLLaMA의 DGX Spark 사용자 글은 NVFP4가 아직 production-ready와 거리가 멀다고 주장했다. 논쟁은 곧 NVIDIA의 프리미엄 로컬 AI 박스가 여전히 가격을 정당화하는지로 번졌다.
#ai-hardware
RSS FeedHacker News에서 큰 반응을 얻은 tinybox는 tinygrad 팀이 판매 중인 딥러닝 전용 워크스테이션이다. red v2와 green v2 Blackwell 구성의 성능, 메모리, 가격, 출하 상태가 한 페이지에 정리됐다.
r/LocalLLaMA는 120B급 로컬 AI workload를 겨냥한 liquid-cooled RISC-V 추론 워크스테이션 TT-QuietBox 2를 주목했다. open tooling, 표준 120V 전원, 공격적인 성능 수치가 함께 제시되면서 Reddit에서는 곧바로 가격 대비 성능과 benchmark 신뢰성을 둘러싼 토론이 이어졌다.
화웨이에서 분리된 스마트폰 브랜드 Honor가 자사의 첫 휴머노이드 로봇을 공개했다. 로봇은 '피트 슬라이드' 문워크 댄스를 선보였으며, 중국의 로봇 경쟁에 새 참가자가 등장했음을 알렸다.
Hacker News 고반응 스레드에서 Taalas의 모델 특화 실리콘 접근이 주목받았다. 회사는 하드와이어드 Llama 3.1 8B 기반으로 사용자당 17K tokens/sec 성능을 주장했다.
Microsoft는 2026-01-26에 Maia 200(코드명 Braga)을 발표하며 추론 최적화 전략을 공식화했다. 회사는 Copilot·Azure AI 일부 워크로드에서 Maia 100 대비 최대 1.7배 성능 향상을 제시했다.
NVIDIA가 차세대 AI 플랫폼 Rubin을 발표했다. Blackwell 대비 추론 토큰 비용 10배 절감, MoE 모델 훈련 GPU 수 4배 감소를 달성하며 2026년 하반기 출시 예정이다.