Skip to content

AI agentの詰まりはGPUだけではない、NVIDIA VeraがCPU側を1.8倍へ

Original: NVIDIA Unveils Vera, the CPU for Agents View original →

Read in other languages: 한국어English
AI Jun 2, 2026 By Insights AI 1 min read Source

AI agentのコスト競争は、GPUとtoken単価だけでは語れなくなっている。NVIDIA Veraは2026年5月31日にfull productionとして示され、agentic AI、reinforcement learning、data processingでx86 CPUよりtask completionが1.8倍速いとされた。狙いは、モデルの外側で起きるコード実行、tool呼び出し、sandbox処理、検証の待ち時間だ。

Veraは88個のOlympus core、Spatial Multithreading、最大1.2TB/sのLPDDR5X memory subsystemを備える。Vera Rubin systemでは、CPUとGPUをNVLink-C2Cで接続し、最大1.8TB/sのcoherent bandwidthを出す。単なるhost CPUではなく、Python runtime、sandboxed code execution、orchestration logic、analytics pipelineをAI factoryの中で処理する部品として位置づけられている。

採用候補の並びが大きい。NVIDIAはAnthropic、OpenAI、SpaceXAI、ByteDance、CoreWeave、Oracle Cloud Infrastructure、Lambda、Nebius、NscaleなどがVeraを検討または導入計画に入れていると説明した。Dell Technologies、HPE、Lenovo、Supermicro、台湾の主要system builderもVera CPU systemを作る。NYSEは1日1.1兆件超のmessageを処理する市場インフラで、Veraを使ったcapacity拡張に触れている。

次の確認点は秋以降の実機だ。Vera systemはsystem builderとcloud partnerから提供される予定で、agent throughput、消費電力、sandbox実行の遅延、運用コストを実測で見る必要がある。それでも今回の意味ははっきりしている。長時間動くagentが増えるほど、AI infrastructureのボトルネックはaccelerator上の推論だけでなく、CPU-boundなtool loopにも広がる。

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment