NVIDIA Rubin CPX, 100만 토큰 처리 가능한 새로운 AI GPU 공개

AI Feb 10, 2026 By Insights AI 1 min read 3 views Source

NVIDIA가 CES 2026에서 대규모 컨텍스트 처리를 위해 특별히 설계된 새로운 클래스의 GPU인 NVIDIA Rubin CPX를 공개했다. 이 GPU는 AI 시스템이 100만 토큰 규모의 소프트웨어 코딩 및 생성형 비디오를 처리할 수 있도록 설계되었다.

Rubin 플랫폼의 핵심 성능

NVIDIA의 차세대 Rubin 플랫폼은 Blackwell 플랫폼 대비 다음과 같은 획기적인 성능 향상을 제공한다:

  • 추론 토큰 비용 최대 10배 감소
  • MoE(Mixture-of-Experts) 모델 훈련에 필요한 GPU 수 4배 감소

NVIDIA는 Rubin 플랫폼을 에이전트형 AI, 고급 추론 모델, MoE 모델에 이상적인 솔루션으로 포지셔닝하고 있다.

Vera Rubin 슈퍼칩

Rubin 플랫폼의 핵심인 Vera Rubin 슈퍼칩은 NVIDIA의 첫 번째 익스트림 코디자인 6칩 AI 플랫폼으로, 하나의 Vera CPU와 두 개의 Rubin GPU를 단일 프로세서로 결합했다.

제품 출시 일정

NVIDIA Rubin은 현재 양산 중이며, Rubin 기반 제품은 2026년 하반기부터 파트너사를 통해 제공될 예정이다. 2026년에 Vera Rubin 기반 인스턴스를 첫 번째로 배포할 클라우드 제공업체는 다음과 같다:

  • AWS
  • Google Cloud
  • Microsoft Azure
  • Oracle Cloud Infrastructure (OCI)
  • NVIDIA 클라우드 파트너: CoreWeave, Lambda, Nebius, Nscale

추가 혁신

NVIDIA는 또한 LLM 기반 코딩 에이전트가 생성한 딥러닝용 오픈소스 연구 시스템 소프트웨어 스택인 VIBETENSOR도 함께 공개했다.

원문 보기

Share:

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.