Nemotron 3 Ultra, 550B MoE로 장시간 agent 비용 30% 낮추는 승부

기업용 agent 경쟁의 초점이 모델 성능표에서 실행 시간과 운영 비용으로 이동하고 있다. NVIDIA가 GTC Taipei 발표에서 내놓은 묶음은 Nemotron 3 Ultra라는 550B 파라미터 mixture-of-experts 모델, NemoClaw blueprint, OpenShell runtime, CUDA-X 라이브러리 skill을 한 흐름으로 연결한다. 모델 하나를 던지는 방식보다, 장시간 실행되는 agent를 실제 업무 시스템에 넣기 위한 하부 구조를 같이 제시한 점이 읽을 만하다.

숫자는 뚜렷하다. NVIDIA는 Nemotron 3 Ultra가 같은 급의 공개 frontier 모델 대비 최대 5배 빠른 inference와 최대 30% 낮은 비용을 제공한다고 설명했다. 대상 작업은 coding, research, enterprise workflow처럼 여러 단계의 추론과 도구 호출이 누적되는 영역이다. post-training도 Hermes Agent, LangChain Deep Agents, OpenClaw, OpenHands, OpenCode 같은 agent platform과 harness를 겨냥했다.

이번 발표에서 중요한 축은 보안 runtime이다. OpenShell은 agent가 파일에 접근하고 도구를 익히며 sub-agent를 만드는 상황을 전제로, policy와 privacy control을 제공한다. Microsoft는 Windows security primitive와 OpenShell을 연결하고, Canonical과 Red Hat은 enterprise server와 full-stack AI platform 쪽 통합을 맡는다. agent가 기업 내부 데이터를 다루려면 모델보다 실행 권한과 로그, 개인정보 처리 방식이 더 큰 병목이 되기 때문이다.

산업 적용 사례도 넓다. Cadence, Dassault Systemes, Siemens, Synopsys는 simulation과 verification workflow를 agent로 줄이는 방향을 시험하고 있고, Cadence의 ChipStack AI Super Agent는 NVIDIA chip design 검증에도 쓰인다. CrowdStrike는 취약점과 policy misconfiguration을 계속 식별하고 우선순위를 매기는 agent에 Nemotron 모델을 활용한다. Palantir는 air-gapped enterprise system을 만드는 AI FDE platform에 Nemotron을 통합한다.

Nemotron 3 Ultra는 6월 4일부터 Hugging Face, ModelScope, OpenRouter, build.nvidia.com의 NIM microservice와 cloud partner를 통해 제공될 예정이다. 아직 실제 배포 후 독립 benchmark와 운영 비용 검증이 남아 있지만, 이번 발표의 방향은 분명하다. agent 시장에서 NVIDIA는 GPU 공급자에 머물기보다 모델, runtime, library skill, enterprise governance까지 묶은 실행 계층을 차지하려 한다.

Nemotron 3 Ultra, 550B MoE로 장시간 agent 비용 30% 낮추는 승부

Related Articles

r/LocalLLaMA가 주목한 NVIDIA의 open-weight 전략, $26B 투자 보도보다 더 중요한 Nemotron 신호

NVIDIA, multi-agent AI용 Nemotron 3 Super 공개

LocalLLaMA가 추적한 NVIDIA Nemotron license 변경, derivative model에는 무엇이 달라졌나

Related Articles

r/LocalLLaMA가 주목한 NVIDIA의 open-weight 전략, $26B 투자 보도보다 더 중요한 Nemotron 신호
LLM Reddit Mar 26, 2026 2 min read

NVIDIA, multi-agent AI용 Nemotron 3 Super 공개
LLM X/Twitter Mar 11, 2026 1 min read

LocalLLaMA가 추적한 NVIDIA Nemotron license 변경, derivative model에는 무엇이 달라졌나
LLM Reddit Mar 16, 2026 2 min read