NVIDIA, agentic AI용 Vera CPU 공개… HN서는 rack-scale 효율 주장에 주목

Original: Nvidia Launches Vera CPU, Purpose-Built for Agentic AI View original →

Read in other languages: English日本語
AI Mar 17, 2026 By Insights AI (HN) 2 min read Source

HN에서 왜 주목받았나

NVIDIA의 Vera 발표는 Hacker News에서 165 points와 98 comments를 기록했다. GPU 중심으로 알려진 NVIDIA가 이번에는 CPU 계층을 전면에 내세웠기 때문이다. 발표의 핵심은 Vera를 일반적인 server CPU가 아니라 agentic AI와 reinforcement learning을 위해 목적에 맞게 설계한 processor로 규정한 점이다. HN 커뮤니티가 관심을 보인 이유도 여기에 있다. AI 시스템에서 GPU만큼이나 CPU, memory, interconnect가 전체 처리량과 운영 효율에 큰 영향을 주기 때문이다.

NVIDIA Newsroom에 따르면 Vera는 Grace CPU를 기반으로 발전한 제품이며, AI factories, coding assistants, consumer agents, enterprise agents를 주요 대상으로 삼는다. 이 설명은 Vera가 단순한 범용 CPU 대체재라기보다, 대규모 agent workload를 조율하고 GPU와 더 긴밀하게 결합되는 역할을 맡는다는 메시지에 가깝다. 특히 agentic AI는 동시에 많은 task를 처리하고, 상태를 자주 넘기며, CPU와 GPU 사이의 coordination 비용이 커질 수 있다는 점에서 이런 설계 철학이 눈길을 끈다.

NVIDIA가 내세운 핵심 주장

NVIDIA는 Vera를 세계 최초의 agentic AI 및 reinforcement learning 전용 processor라고 설명한다. 또한 전통적인 rack-scale CPU 대비 두 배의 efficiency와 50% 더 빠른 결과를 주장했다. 이는 어디까지나 NVIDIA의 설명이지만, HN에서 토론이 커진 배경을 이해하게 해 준다. AI 인프라 운영자 입장에서는 CPU 측 병목이 줄어들면 rack 단위 비용과 처리량 모두에 영향을 줄 수 있기 때문이다.

  • Vera는 88개의 custom Olympus cores를 탑재한다.
  • 각 core는 NVIDIA Spatial Multithreading을 통해 두 개의 task를 실행할 수 있다.
  • memory subsystem은 LPDDR5X를 사용하며 최대 1.2 TB/s bandwidth를 제공한다고 소개됐다.
  • NVIDIA는 이를 범용 CPU 대비 두 배의 bandwidth와 절반의 power로 설명했다.

단일 칩보다 시스템 전략에 가깝다

이번 발표가 중요한 이유는 칩 단품보다 rack 전체 설계가 함께 제시됐다는 점이다. 새로운 Vera CPU rack은 256개의 liquid-cooled Vera CPUs를 통합하고, 22,500개가 넘는 concurrent CPU environments를 지원한다고 NVIDIA는 밝혔다. Vera Rubin NVL72 구성에서는 Vera가 GPU와 NVLink-C2C로 연결되며, coherent bandwidth는 1.8 TB/s로 제시됐다. NVIDIA는 이를 PCIe Gen 6의 7배 수준으로 설명한다. 즉 Vera의 가치는 CPU 단일 성능보다 GPU와의 결합, memory 처리, 대규모 환경 동시성에서 나온다는 뜻이다.

출시 시점과 생태계

NVIDIA는 Vera가 이미 full production에 들어갔고, partner를 통해 2026년 하반기에 제공될 예정이라고 밝혔다. Alibaba, ByteDance, Cloudflare, CoreWeave, Lambda, Meta, Oracle Cloud Infrastructure, Together.AI, Vultr 등이 협력사 또는 고객으로 언급됐다. 이번 HN 반응이 보여 주는 포인트는 단순한 신제품 소개가 아니다. NVIDIA가 GPU 중심 서사를 유지하면서도 CPU, memory, interconnect를 하나의 AI platform으로 묶어 agent workload에 최적화하려 한다는 점이 더 큰 이야기다. Vera는 그 전략에서 CPU가 다시 중요한 차별화 지점이 될 수 있음을 보여 주는 발표로 읽힌다.

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.