NVIDIA Rubin CPX, 100만 토큰 처리 가능한 새로운 AI GPU 공개
NVIDIA가 CES 2026에서 대규모 컨텍스트 처리를 위해 특별히 설계된 새로운 클래스의 GPU인 NVIDIA Rubin CPX를 공개했다. 이 GPU는 AI 시스템이 100만 토큰 규모의 소프트웨어 코딩 및 생성형 비디오를 처리할 수 있도록 설계되었다.
Rubin 플랫폼의 핵심 성능
NVIDIA의 차세대 Rubin 플랫폼은 Blackwell 플랫폼 대비 다음과 같은 획기적인 성능 향상을 제공한다:
- 추론 토큰 비용 최대 10배 감소
- MoE(Mixture-of-Experts) 모델 훈련에 필요한 GPU 수 4배 감소
NVIDIA는 Rubin 플랫폼을 에이전트형 AI, 고급 추론 모델, MoE 모델에 이상적인 솔루션으로 포지셔닝하고 있다.
Vera Rubin 슈퍼칩
Rubin 플랫폼의 핵심인 Vera Rubin 슈퍼칩은 NVIDIA의 첫 번째 익스트림 코디자인 6칩 AI 플랫폼으로, 하나의 Vera CPU와 두 개의 Rubin GPU를 단일 프로세서로 결합했다.
제품 출시 일정
NVIDIA Rubin은 현재 양산 중이며, Rubin 기반 제품은 2026년 하반기부터 파트너사를 통해 제공될 예정이다. 2026년에 Vera Rubin 기반 인스턴스를 첫 번째로 배포할 클라우드 제공업체는 다음과 같다:
- AWS
- Google Cloud
- Microsoft Azure
- Oracle Cloud Infrastructure (OCI)
- NVIDIA 클라우드 파트너: CoreWeave, Lambda, Nebius, Nscale
추가 혁신
NVIDIA는 또한 LLM 기반 코딩 에이전트가 생성한 딥러닝용 오픈소스 연구 시스템 소프트웨어 스택인 VIBETENSOR도 함께 공개했다.
Related Articles
NVIDIAが次世代AI計算プラットフォームVera Rubin NVL72の詳細仕様を公開。Rubin GPUの推論性能はBlackwell GB200の5倍、1トークンあたりのコストは10分の1に削減。2026年後半に出荷開始予定。
NVIDIAは2月17日、Metaとのマルチイヤー・マルチジェネレーション戦略的パートナーシップを発表した。数百万台のBlackwell・Rubin GPU、初の大規模Grace CPU単独展開、WhatsAppへのConfidential Computing採用が含まれる。
NVIDIAのCEO Jensen Huangが2月19日、3月16〜19日開催のGTC 2026で「世界が見たことのない」新チップを公開すると予告。Rubinアーキテクチャを超える次世代ハードウェアへの期待が高まっている。