NVIDIA Rubin CPX, 100만 토큰 처리 가능한 새로운 AI GPU 공개

NVIDIA가 CES 2026에서 대규모 컨텍스트 처리를 위해 특별히 설계된 새로운 클래스의 GPU인 NVIDIA Rubin CPX를 공개했다. 이 GPU는 AI 시스템이 100만 토큰 규모의 소프트웨어 코딩 및 생성형 비디오를 처리할 수 있도록 설계되었다.

Rubin 플랫폼의 핵심 성능

NVIDIA의 차세대 Rubin 플랫폼은 Blackwell 플랫폼 대비 다음과 같은 획기적인 성능 향상을 제공한다:

추론 토큰 비용 최대 10배 감소
MoE(Mixture-of-Experts) 모델 훈련에 필요한 GPU 수 4배 감소

NVIDIA는 Rubin 플랫폼을 에이전트형 AI, 고급 추론 모델, MoE 모델에 이상적인 솔루션으로 포지셔닝하고 있다.

Vera Rubin 슈퍼칩

Rubin 플랫폼의 핵심인 Vera Rubin 슈퍼칩은 NVIDIA의 첫 번째 익스트림 코디자인 6칩 AI 플랫폼으로, 하나의 Vera CPU와 두 개의 Rubin GPU를 단일 프로세서로 결합했다.

제품 출시 일정

NVIDIA Rubin은 현재 양산 중이며, Rubin 기반 제품은 2026년 하반기부터 파트너사를 통해 제공될 예정이다. 2026년에 Vera Rubin 기반 인스턴스를 첫 번째로 배포할 클라우드 제공업체는 다음과 같다:

AWS
Google Cloud
Microsoft Azure
Oracle Cloud Infrastructure (OCI)
NVIDIA 클라우드 파트너: CoreWeave, Lambda, Nebius, Nscale

추가 혁신

NVIDIA는 또한 LLM 기반 코딩 에이전트가 생성한 딥러닝용 오픈소스 연구 시스템 소프트웨어 스택인 VIBETENSOR도 함께 공개했다.

원문 보기

NVIDIA Rubin CPX, 100만 토큰 처리 가능한 새로운 AI GPU 공개

Rubin 플랫폼의 핵심 성능

Vera Rubin 슈퍼칩

제품 출시 일정

추가 혁신

Related Articles

NVIDIA Vera Rubin NVL72 상세 스펙 공개 — Blackwell 대비 5배 성능, 토큰 비용 10분의 1

Intel, GPU 제조 시장 진출 선언...NVIDIA 독점 도전장

Meta와 NVIDIA, 수백만 GPU 대규모 AI 인프라 파트너십 체결

Related Articles

NVIDIA Vera Rubin NVL72 상세 스펙 공개 — Blackwell 대비 5배 성능, 토큰 비용 10분의 1
AI Mar 1, 2026 1 min read

Intel, GPU 제조 시장 진출 선언...NVIDIA 독점 도전장
AI Feb 9, 2026 1 min read

Meta와 NVIDIA, 수백만 GPU 대규모 AI 인프라 파트너십 체결
AI Feb 22, 2026 1 min read