NVIDIA、Rubinプラットフォーム発表... 推論コスト10倍↓・訓練GPU 4倍↓

Rubinプラットフォーム、2026年下半期リリース

NVIDIAが次世代AIプラットフォームRubinを発表した。Rubin基盤製品は2026年下半期からパートナー企業を通じてリリースされる予定で、現在フル生産(full production)段階にある。

Rubinプラットフォームはハードウェアとソフトウェアの極端な共同設計(extreme codesign)により以下を達成した:

2026年にVera Rubin基盤インスタンスを最初に配備するクラウドプロバイダー:

一方、NVIDIAは2026年のゲーミングGPU新製品リリースをスキップすると報じられている。RTX 50 SuperおよびRTX 60シリーズがメモリ不足と収益性の違いにより延期される。

AIチップの利益率は65%であるのに対しグラフィックカードは40%に過ぎず、NVIDIAはAI生産に集中する戦略的転換を実行した。

Rubinプラットフォームのリリースは、NVIDIAがAIインフラ市場での圧倒的優位を2026年以降も維持することを示している。特に推論コスト削減はLLMサービス提供者にとってゲームチェンジャーとなる見込みだ。

出典: NVIDIA Newsroom, TrendForce