NVIDIA, Rubin 플랫폼 양산 돌입... 6개 칩으로 구성된 차세대 AI 슈퍼컴퓨터

Rubin 플랫폼 개요

NVIDIA는 2026년 1월 5일 CES에서 Rubin 플랫폼을 공개했다. 이는 Blackwell 아키텍처의 후속이며, NVIDIA 최초의 6개 칩으로 구성된 극단적 코디자인(extreme-codesigned) AI 플랫폼으로, 현재 양산 중이다.

Rubin 플랫폼은 다음 6개 칩의 극단적 코디자인을 통해 레이어 간 정보 흐름을 최적화하여, 학습 시간과 추론 토큰 비용을 대폭 절감한다:

50 petaflops NVFP4 연산: 3세대 Transformer Engine과 하드웨어 가속 적응형 압축(adaptive compression) 탑재
Blackwell 대비 1/10 비용: Rubin의 실행 비용은 Blackwell 플랫폼의 10분의 1 수준
336억 트랜지스터 GPU: AI 인프라를 재편하는 규모

Vera Rubin은 현재 양산 중이며, 2026년 하반기에 첫 제품이 출시된다. 2026년 Vera Rubin 기반 인스턴스를 배포할 최초의 클라우드 제공업체는 다음과 같다:

NVIDIA는 OpenAI와 전략적 파트너십을 발표하여 10기가와트(10 GW) 규모의 NVIDIA 시스템을 배포한다. 이는 데이터센터 AI 인프라 구축에서 사상 최대 규모의 계약 중 하나다.

Data Center Knowledge는 "NVIDIA가 Rubin을 데이터센터 시장에 출시하며 강력한 입지를 유지한다"고 평가했다. 이번 발표로 NVIDIA는 AI 인프라 시장에서의 지배적 위치를 한층 강화했다.