NVIDIA、agentic AI向けVera CPU公開 50% faster・2x efficiencyを訴求
Original: NVIDIA Launches Vera CPU, Purpose-Built for Agentic AI View original →
NVIDIAが2026年3月23日にVera CPUを公開した。NVIDIAはこのプロセッサを、agentic AIとreinforcement learningの時代に向けてpurpose-builtした最初のCPUと位置付け、従来のrack-scale CPUより50% faster results、2x efficiencyを実現すると主張している。狙うのは、task planning、tool execution、code running、result validationのように、モデル周辺のinfrastructure設計が成果を左右するworkloadだ。
技術仕様もかなり踏み込んでいる。Veraは88個のcustom Olympus core、最大1.2 TB/sのLPDDR5X memory bandwidth、second-generation scalable coherency fabricを採用する。さらにNVIDIAは、256基のliquid-cooled Vera CPUを搭載するrack構成も発表し、22,500超のconcurrent CPU environmentsを維持できるとしている。Vera Rubin NVL72 platformではGPUとNVLink-C2Cで接続され、coherent bandwidthは1.8 TB/s、NVIDIAによればPCIe Gen 6の7倍だという。
- 88 custom NVIDIA-designed Olympus cores
- LPDDR5X memory bandwidthは最大1.2 TB/s
- Vera rackで22,500超のconcurrent CPU environmentsを想定
- Alibaba Cloud、CoreWeave、Meta、Oracle Cloud Infrastructure、Dell、HPE、Lenovo、Supermicroなどを導入候補として提示
重要なのは、NVIDIAがCPUをGPUの補助部品ではなく、agentic systemを駆動する中心要素として語り始めている点だ。Jensen Huangの説明は、AI infra競争が単体GPU性能から、memory、data movement、orchestration、networking、securityを含むrack-level設計へ移っていることを示している。
もっとも、性能と効率の数字はいずれもNVIDIA自身の主張である。市場での本当の評価は、cloud providerやenterpriseがVeraを既存のx86やArm serverと比較し、total cost、migration complexity、software compatibilityをどう見るかで決まる。NVIDIAは、Veraがすでにfull productionに入り、2026年後半にpartner経由で提供されると説明している。
Related Articles
NVIDIA Veraはfull productionに入り、x86 CPU比でtask completionを1.8倍にすると説明された。OpenAI、Anthropic、SpaceXAI、ByteDance、CoreWeave、OCIなどが採用・評価先として挙がる。
NVIDIAはVeraをagentic AIとreinforcement learning向けに設計した初の専用processorと位置付けた。Hacker Newsでは165 points、98 commentsを集め、CPU-GPU結合とrack-scale効率の主張が議論の中心になった。
ゴールドマン・サックス・オルタナティブスの報告書は、エージェントAIシステムが通常のチャットモデルより最大130倍のエネルギーを消費すると警告。米国は2028年までに45GWの電力不足と技術労働者60万人の欠員に直面すると試算している。
Comments (0)
No comments yet. Be the first to comment!