Skip to content
부식 중

NVIDIA Rubin CPX, 100만 토큰 처리 가능한 새로운 AI GPU 공개

AI Feb 10, 2026 By Insights AI 1 min read 22 views Source
This article is not available in your selected language. Showing the original version.

NVIDIA가 CES 2026에서 대규모 컨텍스트 처리를 위해 특별히 설계된 새로운 클래스의 GPU인 NVIDIA Rubin CPX를 공개했다. 이 GPU는 AI 시스템이 100만 토큰 규모의 소프트웨어 코딩 및 생성형 비디오를 처리할 수 있도록 설계되었다.

Rubin 플랫폼의 핵심 성능

NVIDIA의 차세대 Rubin 플랫폼은 Blackwell 플랫폼 대비 다음과 같은 획기적인 성능 향상을 제공한다:

  • 추론 토큰 비용 최대 10배 감소
  • MoE(Mixture-of-Experts) 모델 훈련에 필요한 GPU 수 4배 감소

NVIDIA는 Rubin 플랫폼을 에이전트형 AI, 고급 추론 모델, MoE 모델에 이상적인 솔루션으로 포지셔닝하고 있다.

Vera Rubin 슈퍼칩

Rubin 플랫폼의 핵심인 Vera Rubin 슈퍼칩은 NVIDIA의 첫 번째 익스트림 코디자인 6칩 AI 플랫폼으로, 하나의 Vera CPU와 두 개의 Rubin GPU를 단일 프로세서로 결합했다.

제품 출시 일정

NVIDIA Rubin은 현재 양산 중이며, Rubin 기반 제품은 2026년 하반기부터 파트너사를 통해 제공될 예정이다. 2026년에 Vera Rubin 기반 인스턴스를 첫 번째로 배포할 클라우드 제공업체는 다음과 같다:

  • AWS
  • Google Cloud
  • Microsoft Azure
  • Oracle Cloud Infrastructure (OCI)
  • NVIDIA 클라우드 파트너: CoreWeave, Lambda, Nebius, Nscale

추가 혁신

NVIDIA는 또한 LLM 기반 코딩 에이전트가 생성한 딥러닝용 오픈소스 연구 시스템 소프트웨어 스택인 VIBETENSOR도 함께 공개했다.

원문 보기

Share: Long

Related Articles