NVIDIA Nemotron 3 Nano Omni公開 — ビジョン・音声・言語統合の30Bオープンモデル、同クラス比9倍スループット

マルチモーダルエージェント向けオープンモデル

NVIDIAは2026年4月28日、Nemotron 3 Nano Omniを公開した。Hugging Face、OpenRouter、build.nvidia.comなど25以上のプラットフォームで即日利用可能だ。

従来のマルチモーダルパイプラインでは、視覚・音声・言語をそれぞれ別システムで処理する必要があった。Nemotron 3 Nano Omniはこれを単一モデルに統合し、複数モダリティをリアルタイムで処理するエージェントに最適化されている。

Aible、ASI、Eka Care、Foxconn、H Company、Palantir、Pylerがすでに採用。Dell Technologies、Docusign、Infosys、Oracle、Zefrが評価中だ。

AI Hacker News 6d ago 1 min read

HNの反応は「また音声モデルが来た」よりも、「今回は何が公開されたのか」を確かめる方向に向いた。VibeVoiceは長時間ASRとリアルタイムTTSを前面に出す一方、コミュニティは過去のコード撤回と現在の公開範囲を先に見にいった。

AI Hacker News 6d ago 1 min read

HNはこれを単なるホスティング移転として読まなかった。GitHubに強い愛着を持ってきたmaintainerがもう無理だと公に言い始めた瞬間、reliabilityとproduct focusの問題は背景ノイズではなく警告になる。

AI 2d ago 1 min read

米国防総省が5月1日、Amazon、Google、Microsoft、NVIDIA、OpenAI、SpaceX、Reflection AI 7社と機密ネットワークへのAI展開協定を締結。自律型兵器への安全基準を主張したAnthropicは対象外となった。