NVIDIA Vera Rubin NVL72 상세 스펙 공개 — Blackwell 대비 5배 성능, 토큰 비용 10분의 1

Read in other languages: English日本語
AI Mar 1, 2026 By Insights AI 1 min read Source

Vera Rubin NVL72 개요

엔비디아가 차세대 AI 컴퓨팅 플랫폼 Vera Rubin NVL72의 상세 사양을 공개했다. 72개 Rubin GPU와 36개 Vera CPU로 구성된 이 시스템은 MGX 3세대 설계를 기반으로 하며, 2026년 하반기 출하 예정이다.

핵심 성능 사양

  • 추론 성능: GPU당 NVFP4 기준 50 PFLOPS — Blackwell GB200 대비 5배
  • 학습 성능: GPU당 NVFP4 기준 35 PFLOPS
  • 메모리 대역폭: HBM4 기준 22 TB/s — Blackwell 대비 2.8배
  • 연결 대역폭: 260 TB/s 스케일업 연결
  • 트랜지스터: Rubin GPU당 3,360억 개 — Blackwell 대비 1.6배

비용 효율성

Vera Rubin은 Blackwell 대비 MoE 모델 학습에 필요한 GPU 수를 4분의 1로 줄이고, 백만 토큰당 추론 비용을 10분의 1로 절감한다. 엔비디아 최초 100% 액체 냉각 방식으로 전력 대비 성능이 10배 개선됐다.

출시 일정 및 파트너십

AWS, Google Cloud, Microsoft Azure, OCI, CoreWeave, Lambda, Nebius, Nscale이 2026년 하반기부터 Vera Rubin 기반 인스턴스를 제공한다. 130만 개 부품으로 구성된 엔비디아 역사상 가장 복잡한 하드웨어다.

출처: CNBC

Share:

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.