NVIDIA Vera Rubin NVL72 상세 스펙 공개 — Blackwell 대비 5배 성능, 토큰 비용 10분의 1
Vera Rubin NVL72 개요
엔비디아가 차세대 AI 컴퓨팅 플랫폼 Vera Rubin NVL72의 상세 사양을 공개했다. 72개 Rubin GPU와 36개 Vera CPU로 구성된 이 시스템은 MGX 3세대 설계를 기반으로 하며, 2026년 하반기 출하 예정이다.
핵심 성능 사양
- 추론 성능: GPU당 NVFP4 기준 50 PFLOPS — Blackwell GB200 대비 5배
- 학습 성능: GPU당 NVFP4 기준 35 PFLOPS
- 메모리 대역폭: HBM4 기준 22 TB/s — Blackwell 대비 2.8배
- 연결 대역폭: 260 TB/s 스케일업 연결
- 트랜지스터: Rubin GPU당 3,360억 개 — Blackwell 대비 1.6배
비용 효율성
Vera Rubin은 Blackwell 대비 MoE 모델 학습에 필요한 GPU 수를 4분의 1로 줄이고, 백만 토큰당 추론 비용을 10분의 1로 절감한다. 엔비디아 최초 100% 액체 냉각 방식으로 전력 대비 성능이 10배 개선됐다.
출시 일정 및 파트너십
AWS, Google Cloud, Microsoft Azure, OCI, CoreWeave, Lambda, Nebius, Nscale이 2026년 하반기부터 Vera Rubin 기반 인스턴스를 제공한다. 130만 개 부품으로 구성된 엔비디아 역사상 가장 복잡한 하드웨어다.
출처: CNBC
Related Articles
NVIDIA가 대규모 컨텍스트 처리 전용 GPU Rubin CPX 발표. 소프트웨어 코딩과 생성형 비디오에서 100만 토큰 이상 처리 가능하며, 2026년 하반기 AWS, Google Cloud, Microsoft 등을 통해 제공 예정.
Intel CEO Lip-Bu Tan이 Cisco AI Summit에서 GPU 제조 시작을 공식 발표했다. NVIDIA가 독점하던 GPU 시장에 대형 반도체 제조사가 본격 진출하며 경쟁 구도가 재편될 전망이다.
NVIDIA가 2월 17일 Meta와 멀티이어·멀티세대 전략적 파트너십을 발표했다. 수백만 개의 Blackwell·Rubin GPU와 최초 대규모 Grace CPU 단독 배포, WhatsApp 프라이버시 컴퓨팅이 핵심이다.