Skip to content

Nemotron 3 Ultra, 550B MoE로 장시간 agent 비용 30% 낮추는 승부

Original: Enterprise Software Leaders Build AI Agents With NVIDIA View original →

Read in other languages: English日本語
LLM Jun 1, 2026 By Insights AI 1 min read 1 views Source

기업용 agent 경쟁의 초점이 모델 성능표에서 실행 시간과 운영 비용으로 이동하고 있다. NVIDIA가 GTC Taipei 발표에서 내놓은 묶음은 Nemotron 3 Ultra라는 550B 파라미터 mixture-of-experts 모델, NemoClaw blueprint, OpenShell runtime, CUDA-X 라이브러리 skill을 한 흐름으로 연결한다. 모델 하나를 던지는 방식보다, 장시간 실행되는 agent를 실제 업무 시스템에 넣기 위한 하부 구조를 같이 제시한 점이 읽을 만하다.

숫자는 뚜렷하다. NVIDIA는 Nemotron 3 Ultra가 같은 급의 공개 frontier 모델 대비 최대 5배 빠른 inference와 최대 30% 낮은 비용을 제공한다고 설명했다. 대상 작업은 coding, research, enterprise workflow처럼 여러 단계의 추론과 도구 호출이 누적되는 영역이다. post-training도 Hermes Agent, LangChain Deep Agents, OpenClaw, OpenHands, OpenCode 같은 agent platform과 harness를 겨냥했다.

이번 발표에서 중요한 축은 보안 runtime이다. OpenShell은 agent가 파일에 접근하고 도구를 익히며 sub-agent를 만드는 상황을 전제로, policy와 privacy control을 제공한다. Microsoft는 Windows security primitive와 OpenShell을 연결하고, Canonical과 Red Hat은 enterprise server와 full-stack AI platform 쪽 통합을 맡는다. agent가 기업 내부 데이터를 다루려면 모델보다 실행 권한과 로그, 개인정보 처리 방식이 더 큰 병목이 되기 때문이다.

산업 적용 사례도 넓다. Cadence, Dassault Systemes, Siemens, Synopsys는 simulation과 verification workflow를 agent로 줄이는 방향을 시험하고 있고, Cadence의 ChipStack AI Super Agent는 NVIDIA chip design 검증에도 쓰인다. CrowdStrike는 취약점과 policy misconfiguration을 계속 식별하고 우선순위를 매기는 agent에 Nemotron 모델을 활용한다. Palantir는 air-gapped enterprise system을 만드는 AI FDE platform에 Nemotron을 통합한다.

Nemotron 3 Ultra는 6월 4일부터 Hugging Face, ModelScope, OpenRouter, build.nvidia.com의 NIM microservice와 cloud partner를 통해 제공될 예정이다. 아직 실제 배포 후 독립 benchmark와 운영 비용 검증이 남아 있지만, 이번 발표의 방향은 분명하다. agent 시장에서 NVIDIA는 GPU 공급자에 머물기보다 모델, runtime, library skill, enterprise governance까지 묶은 실행 계층을 차지하려 한다.

Share: Long

Related Articles

LLM Reddit Mar 26, 2026 2 min read

r/LocalLLaMA에서는 NVIDIA가 향후 5년간 open-weight AI model에 $26 billion을 투입할 수 있다는 보도가 빠르게 확산됐지만, 핵심 논의는 숫자보다 전략에 있었다. March 2026에 공개된 Nemotron 3 Super는 NVIDIA가 open model, tooling, Blackwell 최적화 deployment를 하나의 묶음으로 밀고 있음을 보여주는 가장 분명한 증거다.

LLM X/Twitter Mar 11, 2026 1 min read

NVIDIA AI Developer는 2026년 3월 11일 Nemotron 3 Super를 공개하며, 12B active parameters를 사용하는 오픈 120B-parameter hybrid MoE 모델과 native 1M-token context를 강조했다. NVIDIA는 이 모델이 이전 Nemotron Super 대비 최대 5배 높은 throughput으로 agentic workload를 겨냥한다고 설명했다.

LLM Reddit Mar 16, 2026 2 min read

3월 15일 LocalLLaMA에서 높은 반응을 얻은 Nemotron license thread는 model release에서 weights만큼 중요한 것이 license wording임을 다시 보여 줬다. 공식 NVIDIA Nemotron Model License와 이전 Open Model License를 비교하면, community가 주목한 포인트는 예전 guardrail termination clause와 Trustworthy AI 참조가 사라지고, 대신 NOTICE 중심의 attribution 구조가 더 전면으로 나온 점이었다.

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment