AI agentの詰まりはGPUだけではない、NVIDIA VeraがCPU側を1.8倍へ

AI agentのコスト競争は、GPUとtoken単価だけでは語れなくなっている。NVIDIA Veraは2026年5月31日にfull productionとして示され、agentic AI、reinforcement learning、data processingでx86 CPUよりtask completionが1.8倍速いとされた。狙いは、モデルの外側で起きるコード実行、tool呼び出し、sandbox処理、検証の待ち時間だ。

Veraは88個のOlympus core、Spatial Multithreading、最大1.2TB/sのLPDDR5X memory subsystemを備える。Vera Rubin systemでは、CPUとGPUをNVLink-C2Cで接続し、最大1.8TB/sのcoherent bandwidthを出す。単なるhost CPUではなく、Python runtime、sandboxed code execution、orchestration logic、analytics pipelineをAI factoryの中で処理する部品として位置づけられている。

採用候補の並びが大きい。NVIDIAはAnthropic、OpenAI、SpaceXAI、ByteDance、CoreWeave、Oracle Cloud Infrastructure、Lambda、Nebius、NscaleなどがVeraを検討または導入計画に入れていると説明した。Dell Technologies、HPE、Lenovo、Supermicro、台湾の主要system builderもVera CPU systemを作る。NYSEは1日1.1兆件超のmessageを処理する市場インフラで、Veraを使ったcapacity拡張に触れている。

次の確認点は秋以降の実機だ。Vera systemはsystem builderとcloud partnerから提供される予定で、agent throughput、消費電力、sandbox実行の遅延、運用コストを実測で見る必要がある。それでも今回の意味ははっきりしている。長時間動くagentが増えるほど、AI infrastructureのボトルネックはaccelerator上の推論だけでなく、CPU-boundなtool loopにも広がる。

AI agentの詰まりはGPUだけではない、NVIDIA VeraがCPU側を1.8倍へ

Related Articles

NVIDIA Vera、agent loop向けCPUでx86比1.8倍のper-core性能

SpatialClaw、20ベンチマークで既存空間エージェントを11.2点上回る

AlphaEvolveがGAへ、Google Cloudがアルゴリズム探索を商品化