NVIDIA Vera Rubin NVL72 상세 스펙 공개 — Blackwell 대비 5배 성능, 토큰 비용 10분의 1
Vera Rubin NVL72 개요
엔비디아가 차세대 AI 컴퓨팅 플랫폼 Vera Rubin NVL72의 상세 사양을 공개했다. 72개 Rubin GPU와 36개 Vera CPU로 구성된 이 시스템은 MGX 3세대 설계를 기반으로 하며, 2026년 하반기 출하 예정이다.
핵심 성능 사양
- 추론 성능: GPU당 NVFP4 기준 50 PFLOPS — Blackwell GB200 대비 5배
- 학습 성능: GPU당 NVFP4 기준 35 PFLOPS
- 메모리 대역폭: HBM4 기준 22 TB/s — Blackwell 대비 2.8배
- 연결 대역폭: 260 TB/s 스케일업 연결
- 트랜지스터: Rubin GPU당 3,360억 개 — Blackwell 대비 1.6배
비용 효율성
Vera Rubin은 Blackwell 대비 MoE 모델 학습에 필요한 GPU 수를 4분의 1로 줄이고, 백만 토큰당 추론 비용을 10분의 1로 절감한다. 엔비디아 최초 100% 액체 냉각 방식으로 전력 대비 성능이 10배 개선됐다.
출시 일정 및 파트너십
AWS, Google Cloud, Microsoft Azure, OCI, CoreWeave, Lambda, Nebius, Nscale이 2026년 하반기부터 Vera Rubin 기반 인스턴스를 제공한다. 130만 개 부품으로 구성된 엔비디아 역사상 가장 복잡한 하드웨어다.
출처: CNBC
Related Articles
NVIDIA가 CES 2026에서 Vera Rubin 슈퍼칩과 Rubin CPX GPU를 발표했다. Rubin 플랫폼은 Blackwell 대비 MoE 훈련에 필요한 GPU 수를 4배 줄이고, 추론 토큰 비용을 10배 절감한다.
NVIDIA가 Blackwell의 후속인 Rubin 플랫폼을 CES 2026에서 공개하고 양산에 돌입했다. 6개 칩으로 구성된 이 플랫폼은 Blackwell 대비 1/10의 비용으로 AI 추론을 수행한다.
NVIDIA가 대규모 컨텍스트 처리 전용 GPU Rubin CPX 발표. 소프트웨어 코딩과 생성형 비디오에서 100만 토큰 이상 처리 가능하며, 2026년 하반기 AWS, Google Cloud, Microsoft 등을 통해 제공 예정.
Comments (0)
No comments yet. Be the first to comment!