AI agentの詰まりはGPUだけではない、NVIDIA VeraがCPU側を1.8倍へ
Original: NVIDIA Unveils Vera, the CPU for Agents View original →
AI agentのコスト競争は、GPUとtoken単価だけでは語れなくなっている。NVIDIA Veraは2026年5月31日にfull productionとして示され、agentic AI、reinforcement learning、data processingでx86 CPUよりtask completionが1.8倍速いとされた。狙いは、モデルの外側で起きるコード実行、tool呼び出し、sandbox処理、検証の待ち時間だ。
Veraは88個のOlympus core、Spatial Multithreading、最大1.2TB/sのLPDDR5X memory subsystemを備える。Vera Rubin systemでは、CPUとGPUをNVLink-C2Cで接続し、最大1.8TB/sのcoherent bandwidthを出す。単なるhost CPUではなく、Python runtime、sandboxed code execution、orchestration logic、analytics pipelineをAI factoryの中で処理する部品として位置づけられている。
採用候補の並びが大きい。NVIDIAはAnthropic、OpenAI、SpaceXAI、ByteDance、CoreWeave、Oracle Cloud Infrastructure、Lambda、Nebius、NscaleなどがVeraを検討または導入計画に入れていると説明した。Dell Technologies、HPE、Lenovo、Supermicro、台湾の主要system builderもVera CPU systemを作る。NYSEは1日1.1兆件超のmessageを処理する市場インフラで、Veraを使ったcapacity拡張に触れている。
次の確認点は秋以降の実機だ。Vera systemはsystem builderとcloud partnerから提供される予定で、agent throughput、消費電力、sandbox実行の遅延、運用コストを実測で見る必要がある。それでも今回の意味ははっきりしている。長時間動くagentが増えるほど、AI infrastructureのボトルネックはaccelerator上の推論だけでなく、CPU-boundなtool loopにも広がる。
Related Articles
xAIはGrokをチャットからアプリ制作と自動化の道具へ広げた。Plan Mode、Imagine、CLIを組み合わせたベータ投稿は5,300万回超の表示を集めた。
Claude CodeやCoworkが実作業の権限を持つほど、リスク管理は説得文ではなく実行環境の制御に寄る。Anthropicは、Claude Codeの権限プロンプトが約93%承認されていたと明かした。
NVIDIAが2026年3月23日にVera CPUを公開した。agentic AIとreinforcement learning時代に向けた専用CPUと位置付け、従来rack-scale CPU比で50%高速、効率2倍だと主張している。
Comments (0)
No comments yet. Be the first to comment!