NVIDIA、Nemotron 3 Superを公開 agentic AI向けopen modelで5x higher throughputを提示

Original: New NVIDIA Nemotron 3 Super Delivers 5x Higher Throughput for Agentic AI View original →

Read in other languages: 한국어English
LLM Mar 16, 2026 By Insights AI 1 min read Source

NVIDIAはMarch 11, 2026、agentic AI system向けの新しい open model である Nemotron 3 Super を公開した。NVIDIAはこれを、NVIDIA Blackwell に最適化した 120-billion-parameter hybrid mixture-of-experts model と説明し、実際に使われるのは 12 billion active parameters だとしている。今回の発表の焦点は、一般的な chat quality 競争ではなく、長い reasoning chain と多い tool use を含む production agent workflow で膨らむ cost と latency をどう抑えるかに置かれていた。

NVIDIAは multi-agent system の主要な問題として “context explosion” を挙げる。複数の agent が連携するほど、history、tool output、intermediate reasoning を何度も送り直す必要があり、そのたびに latency と cost が増えるという見立てだ。Nemotron 3 Super はその問題に対応するため、1-million-token context window を備え、より長い workflow state を memory に保ちやすくしたとNVIDIAは説明している。

NVIDIAが示したポイント

NVIDIAによれば、Nemotron 3 Super は previous Nemotron Super と比べて最大 5x higher throughput、最大 2x higher accuracy を実現する。さらに、large function library を扱う agent stack で重要になる high-accuracy tool calling も前面に出した。agentic AI の運用では、誤った function を選ぶだけで workflow 全体が崩れるため、tool routing の精度は実用上の中心指標になる。

配布経路も重要だ。NVIDIAは Nemotron 3 Super を permissive license の open weights として公開し、workstation、data center、cloud のいずれでも customize できると述べた。利用先として build.nvidia.com、Perplexity、OpenRouter、Hugging Face を挙げている。加えて、CodeRabbit、Factory、Greptile のような software agent vendor や、Edison Scientific、Lila Sciences のような research・life science 組織が初期利用例として紹介された。

なぜ重要か

今回のリリースが重要なのは、enterprise agent builder がいま求めているのが、単なる raw model quality ではなく、throughput、long context、tool reliability を同時に満たす open model だからだ。1-million-token context がすべての failure を防ぐわけではないが、長い workflow で state を圧縮したり捨てたりする回数を減らせる可能性がある。そこに tool calling の精度向上が重なると、誤った action を実行するリスクも下げやすい。

Developer の視点では、Nemotron 3 Super の意味は headline の parameter count より system economics にある。NVIDIAの throughput と accuracy の主張が downstream test でも再現されれば、autonomous research、code review、security、enterprise workflow agent を構築する team にとって、open weights と柔軟な deployment path を両立する有力候補になりそうだ。

Source

Share: Long

Related Articles

LLM sources.twitter 5d ago 1 min read

NVIDIA AI Developerは2026年3月11日、12B active parametersを用いるオープン120B-parameter hybrid MoEモデル Nemotron 3 Super を発表した。NVIDIAはnative 1M-token contextと、前世代Nemotron Super比で最大5倍のthroughputを強調している。

LLM Reddit 1d ago 1 min read

2026年3月15日に高い反応を集めたLocalLLaMA threadは、NVIDIA Nemotron model familyのlicense変更に注目した。現在のNVIDIA Nemotron Model Licenseを以前のOpen Model Licenseと比べると、communityが反応した理由は明快だ。以前のguardrail termination clauseとTrustworthy AIへの参照が見当たらなくなり、代わりにNOTICEベースのattribution構造が前面に出ている。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.