NVIDIA Rubin CPX, 100만 토큰 처리 가능한 새로운 AI GPU 공개
NVIDIA가 CES 2026에서 대규모 컨텍스트 처리를 위해 특별히 설계된 새로운 클래스의 GPU인 NVIDIA Rubin CPX를 공개했다. 이 GPU는 AI 시스템이 100만 토큰 규모의 소프트웨어 코딩 및 생성형 비디오를 처리할 수 있도록 설계되었다.
Rubin 플랫폼의 핵심 성능
NVIDIA의 차세대 Rubin 플랫폼은 Blackwell 플랫폼 대비 다음과 같은 획기적인 성능 향상을 제공한다:
- 추론 토큰 비용 최대 10배 감소
- MoE(Mixture-of-Experts) 모델 훈련에 필요한 GPU 수 4배 감소
NVIDIA는 Rubin 플랫폼을 에이전트형 AI, 고급 추론 모델, MoE 모델에 이상적인 솔루션으로 포지셔닝하고 있다.
Vera Rubin 슈퍼칩
Rubin 플랫폼의 핵심인 Vera Rubin 슈퍼칩은 NVIDIA의 첫 번째 익스트림 코디자인 6칩 AI 플랫폼으로, 하나의 Vera CPU와 두 개의 Rubin GPU를 단일 프로세서로 결합했다.
제품 출시 일정
NVIDIA Rubin은 현재 양산 중이며, Rubin 기반 제품은 2026년 하반기부터 파트너사를 통해 제공될 예정이다. 2026년에 Vera Rubin 기반 인스턴스를 첫 번째로 배포할 클라우드 제공업체는 다음과 같다:
- AWS
- Google Cloud
- Microsoft Azure
- Oracle Cloud Infrastructure (OCI)
- NVIDIA 클라우드 파트너: CoreWeave, Lambda, Nebius, Nscale
추가 혁신
NVIDIA는 또한 LLM 기반 코딩 에이전트가 생성한 딥러닝용 오픈소스 연구 시스템 소프트웨어 스택인 VIBETENSOR도 함께 공개했다.
Related Articles
엔비디아가 차세대 AI 컴퓨팅 시스템 Vera Rubin NVL72의 상세 사양을 공개했다. GPU당 추론 성능이 Blackwell의 5배이며 토큰당 추론 비용은 10분의 1로 절감된다. 2026년 하반기 출하 예정.
Intel CEO Lip-Bu Tan이 Cisco AI Summit에서 GPU 제조 시작을 공식 발표했다. NVIDIA가 독점하던 GPU 시장에 대형 반도체 제조사가 본격 진출하며 경쟁 구도가 재편될 전망이다.
NVIDIA가 2월 17일 Meta와 멀티이어·멀티세대 전략적 파트너십을 발표했다. 수백만 개의 Blackwell·Rubin GPU와 최초 대규모 Grace CPU 단독 배포, WhatsApp 프라이버시 컴퓨팅이 핵심이다.