NVIDIA Nemotron 3 Nano Omni公開 — ビジョン・音声・言語統合の30Bオープンモデル、同クラス比9倍スループット
マルチモーダルエージェント向けオープンモデル
NVIDIAは2026年4月28日、Nemotron 3 Nano Omniを公開した。Hugging Face、OpenRouter、build.nvidia.comなど25以上のプラットフォームで即日利用可能だ。
技術仕様
- アーキテクチャ: 30B-A3B ハイブリッドMoE(Conv3D、EVS搭載)
- コンテキスト: 256Kトークン
- 処理対象: ビデオ・オーディオ・画像・テキストを単一モデルで処理
- スループット: 同クラスのオープンオムニモデルより9倍高速
マルチモーダルエージェントに最適化
従来のマルチモーダルパイプラインでは、視覚・音声・言語をそれぞれ別システムで処理する必要があった。Nemotron 3 Nano Omniはこれを単一モデルに統合し、複数モダリティをリアルタイムで処理するエージェントに最適化されている。
導入状況
Aible、ASI、Eka Care、Foxconn、H Company、Palantir、Pylerがすでに採用。Dell Technologies、Docusign、Infosys、Oracle、Zefrが評価中だ。
出典: NVIDIA Blog
Related Articles
AI Hacker News 6d ago 1 min read
HNの反応は「また音声モデルが来た」よりも、「今回は何が公開されたのか」を確かめる方向に向いた。VibeVoiceは長時間ASRとリアルタイムTTSを前面に出す一方、コミュニティは過去のコード撤回と現在の公開範囲を先に見にいった。
AI Hacker News 6d ago 1 min read
HNはこれを単なるホスティング移転として読まなかった。GitHubに強い愛着を持ってきたmaintainerがもう無理だと公に言い始めた瞬間、reliabilityとproduct focusの問題は背景ノイズではなく警告になる。
AI 2d ago 1 min read
米国防総省が5月1日、Amazon、Google、Microsoft、NVIDIA、OpenAI、SpaceX、Reflection AI 7社と機密ネットワークへのAI展開協定を締結。自律型兵器への安全基準を主張したAnthropicは対象外となった。
Comments (0)
No comments yet. Be the first to comment!