NVIDIA Nemotron 3 Nano Omni — 비전·음성·언어 통합, 동급 대비 처리량 9배

Read in other languages: English日本語
AI May 5, 2026 By Insights AI 1 min read Source

하나의 모델로 비디오·오디오·이미지·텍스트 처리

NVIDIA는 2026년 4월 28일 Nemotron 3 Nano Omni를 공개했다. 허깅페이스, OpenRouter, build.nvidia.com을 포함한 25개 이상 플랫폼에서 즉시 사용 가능하다.

기술 사양

  • 아키텍처: 30B-A3B 하이브리드 MoE (Conv3D, EVS 포함)
  • 컨텍스트: 256K 토큰
  • 처리 범위: 비디오, 오디오, 이미지, 텍스트 통합
  • 성능: 동급 오픈 옴니 모델 대비 9배 높은 처리량

멀티모달 에이전트를 겨냥한 설계

기존 멀티모달 파이프라인은 시각 처리, 음성 인식, 언어 모델을 별도로 연결해야 했다. Nemotron 3 Nano Omni는 이를 하나의 모델에 통합해 지연 시간과 인프라 복잡성을 줄였다.

도입 현황

Aible, ASI, Eka Care, Foxconn, H Company, Palantir, Pyler가 이미 도입했으며, Dell Technologies, Docusign, Infosys, Oracle, Zefr가 평가 중이다.

출처: NVIDIA Blog

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment