#ai-hardware

AI Reddit Apr 5, 2026 1 min read

LocalLLaMA 경고: DGX Spark의 NVFP4는 아직 production-ready 단계가 아니라는 지적

LocalLLaMA의 DGX Spark 사용자 글은 NVFP4가 아직 production-ready와 거리가 멀다고 주장했다. 논쟁은 곧 NVIDIA의 프리미엄 로컬 AI 박스가 여전히 가격을 정당화하는지로 번졌다.

#ai-hardware #nvidia #dgx-spark

AI Hacker News Mar 22, 2026 1 min read

tinybox: 딥러닝을 위한 강력한 컴퓨터

Hacker News에서 큰 반응을 얻은 tinybox는 tinygrad 팀이 판매 중인 딥러닝 전용 워크스테이션이다. red v2와 green v2 Blackwell 구성의 성능, 메모리, 가격, 출하 상태가 한 페이지에 정리됐다.

#tinygrad #deep-learning #ai-hardware

AI Reddit Mar 14, 2026 2 min read

r/LocalLLaMA, 로컬 AI 추론용 desk-side RISC-V box Tenstorrent QuietBox 2 주목

r/LocalLLaMA는 120B급 로컬 AI workload를 겨냥한 liquid-cooled RISC-V 추론 워크스테이션 TT-QuietBox 2를 주목했다. open tooling, 표준 120V 전원, 공격적인 성능 수치가 함께 제시되면서 Reddit에서는 곧바로 가격 대비 성능과 benchmark 신뢰성을 둘러싼 토론이 이어졌다.

#tenstorrent #risc-v #ai-hardware

Humanoid Robots Reddit Mar 2, 2026 1 min read

Honor, 문워크 댄스 선보이는 휴머노이드 로봇 공개

화웨이에서 분리된 스마트폰 브랜드 Honor가 자사의 첫 휴머노이드 로봇을 공개했다. 로봇은 '피트 슬라이드' 문워크 댄스를 선보였으며, 중국의 로봇 경쟁에 새 참가자가 등장했음을 알렸다.

#humanoid-robot #honor #robotics

LLM Hacker News Feb 20, 2026 1 min read

Taalas, 모델 특화 실리콘으로 저지연 AI 추론 전략 제시

Hacker News 고반응 스레드에서 Taalas의 모델 특화 실리콘 접근이 주목받았다. 회사는 하드와이어드 Llama 3.1 8B 기반으로 사용자당 17K tokens/sec 성능을 주장했다.

#llm #inference #ai-hardware

AI Feb 19, 2026 1 min read

Microsoft, Maia 200 공개: Azure 추론 워크로드용 2세대 AI 가속기

Microsoft는 2026-01-26에 Maia 200(코드명 Braga)을 발표하며 추론 최적화 전략을 공식화했다. 회사는 Copilot·Azure AI 일부 워크로드에서 Maia 100 대비 최대 1.7배 성능 향상을 제시했다.

#microsoft #maia-200 #inference

AI Feb 13, 2026 1 min read

NVIDIA, Rubin 플랫폼 출시... 추론 비용 10배↓·훈련 GPU 4배↓

NVIDIA가 차세대 AI 플랫폼 Rubin을 발표했다. Blackwell 대비 추론 토큰 비용 10배 절감, MoE 모델 훈련 GPU 수 4배 감소를 달성하며 2026년 하반기 출시 예정이다.

#nvidia #rubin #gpu