NVIDIA Vera Rubinプラットフォーム発表... MoE学習GPU 75%削減·推論コスト10倍減少

CES 2026でVera Rubin公開

NVIDIAがCES 2026で次世代AIプラットフォームVera Rubinを発表した。Rubinは1つのVera CPUと2つのRubin GPUを単一プロセッサに統合したスーパーチップで、6つのチップで構成されるRubinプラットフォームのコアだ。

NVIDIAはRubinプラットフォームが既存のBlackwellシステムと比較して次のような性能改善を提供すると発表した:

これは特にGPT-4、Llama 4 Maverick、DeepSeek V4のような大規模Mixture-of-Experts(MoE)モデルに最適化されている。

NVIDIAはRubinプラットフォームをエージェンティックAI(Agentic AI)、高度な推論モデル(Advanced Reasoning Models)、MoEモデルに理想的だと強調した。これは2026年のAI業界の主要トレンドを反映している。

Rubinプラットフォームは現在フルプロダクション段階にあり、2026年下半期からパートナー企業を通じて製品がリリースされる。主要クラウドプロバイダー(AWS、Google Cloud、Microsoft Azure)およびサーバーメーカーがRubinベースの製品を準備中だ。

一方、NVIDIAは30年ぶりに初めて2026年の1年間、新しいゲーミングGPUをリリースしないと報じられた。グローバルメモリ不足により、NVIDIAが限られたメモリ容量をAIアクセラレータに優先配分するためだ。

NVIDIAはまたVibeTensorを公開した。これはLLMコーディングエージェントが生成したPyTorchスタイルのディープラーニングランタイムで、Apache 2.0ライセンスでオープンソース化された。Linux x86_64 + NVIDIA GPU + CUDAを必須要件とする。