NVIDIA Rubin CPX, 100만 토큰 처리 가능한 새로운 AI GPU 공개
NVIDIA가 CES 2026에서 대규모 컨텍스트 처리를 위해 특별히 설계된 새로운 클래스의 GPU인 NVIDIA Rubin CPX를 공개했다. 이 GPU는 AI 시스템이 100만 토큰 규모의 소프트웨어 코딩 및 생성형 비디오를 처리할 수 있도록 설계되었다.
Rubin 플랫폼의 핵심 성능
NVIDIA의 차세대 Rubin 플랫폼은 Blackwell 플랫폼 대비 다음과 같은 획기적인 성능 향상을 제공한다:
- 추론 토큰 비용 최대 10배 감소
- MoE(Mixture-of-Experts) 모델 훈련에 필요한 GPU 수 4배 감소
NVIDIA는 Rubin 플랫폼을 에이전트형 AI, 고급 추론 모델, MoE 모델에 이상적인 솔루션으로 포지셔닝하고 있다.
Vera Rubin 슈퍼칩
Rubin 플랫폼의 핵심인 Vera Rubin 슈퍼칩은 NVIDIA의 첫 번째 익스트림 코디자인 6칩 AI 플랫폼으로, 하나의 Vera CPU와 두 개의 Rubin GPU를 단일 프로세서로 결합했다.
제품 출시 일정
NVIDIA Rubin은 현재 양산 중이며, Rubin 기반 제품은 2026년 하반기부터 파트너사를 통해 제공될 예정이다. 2026년에 Vera Rubin 기반 인스턴스를 첫 번째로 배포할 클라우드 제공업체는 다음과 같다:
- AWS
- Google Cloud
- Microsoft Azure
- Oracle Cloud Infrastructure (OCI)
- NVIDIA 클라우드 파트너: CoreWeave, Lambda, Nebius, Nscale
추가 혁신
NVIDIA는 또한 LLM 기반 코딩 에이전트가 생성한 딥러닝용 오픈소스 연구 시스템 소프트웨어 스택인 VIBETENSOR도 함께 공개했다.
Related Articles
NVIDIA가 CES 2026에서 Vera Rubin 슈퍼칩과 Rubin CPX GPU를 발표했다. Rubin 플랫폼은 Blackwell 대비 MoE 훈련에 필요한 GPU 수를 4배 줄이고, 추론 토큰 비용을 10배 절감한다.
엔비디아가 차세대 AI 컴퓨팅 시스템 Vera Rubin NVL72의 상세 사양을 공개했다. GPU당 추론 성능이 Blackwell의 5배이며 토큰당 추론 비용은 10분의 1로 절감된다. 2026년 하반기 출하 예정.
NVIDIA가 Blackwell의 후속인 Rubin 플랫폼을 CES 2026에서 공개하고 양산에 돌입했다. 6개 칩으로 구성된 이 플랫폼은 Blackwell 대비 1/10의 비용으로 AI 추론을 수행한다.
Comments (0)
No comments yet. Be the first to comment!