NVIDIA, 256K 문맥의 30B 옴니 모델 공개… 기업형 영상 추론 처리량은 최대 9.2배

Original: NVIDIA opens a 30B omni model with 256K context and 9.2x video capacity View original →

Read in other languages: English日本語
LLM Apr 29, 2026 By Insights AI 1 min read Source

왜 이 숫자가 먼저 보이나

멀티모달 에이전트의 병목은 모델 성능 하나가 아니라 조합 비용인 경우가 많다. 비전 모델, 오디오 모델, 텍스트 모델을 따로 이어 붙이면 추론 홉이 늘고, 문맥 일관성도 흔들린다. NVIDIA가 4월 28일 X에 올린 Nemotron 3 Nano Omni 포스트는 바로 그 비용 구조를 겨냥한다. 회사는 이 모델을 "30B parameters. 256K context length."라는 짧은 문장으로 묶었지만, 실은 멀티모달 서브에이전트를 한 모델로 모으겠다는 제안에 가깝다.

"30B parameters. 256K context length."

NVIDIA AI 계정은 Nemotron, NeMo, 배포 스택 업데이트를 한데 묶어 내보내는 릴리스 채널 성격이 강하다. 이번에도 공식 기술 블로그가 곧바로 붙었다. 블로그는 Nemotron 3 Nano Omni를 30B total / 3B active 하이브리드 MoE로 설명하면서, 문서·영상·오디오·이미지를 따로 쪼갠 파이프라인 대신 하나의 인식 서브에이전트로 쓰겠다는 방향을 분명히 적었다. 이 접근이 먹히면 멀티모달 워크플로 설계 자체가 단순해진다.

주장도 꽤 공격적이다. NVIDIA는 MMlongbench-Doc, OCRBenchV2, WorldSense, DailyOmni, VoiceBench 같은 벤치마크에서 선두권 정확도를 내세웠고, 같은 반응성 기준에서 영상 추론 시스템 용량이 대안 오픈 옴니 모델 대비 최대 9.2배, 다문서 추론은 최대 7.4배라고 적었다. 여기에 오픈 가중치뿐 아니라 데이터셋과 학습 레시피도 함께 풀었고, 약 127B 멀티모달 토큰, 124M 큐레이션 예제, 25개 환경에 걸친 RL 데이터셋 정보까지 공개했다. 단순 모델 카드 한 장이 아니라 스택 전체를 공개하겠다는 쪽에 가깝다.

다음은 외부 재현이다. 미디어 벤치마크 수치가 다른 하드웨어와 서빙 엔진에서도 그대로 나오는지, 그리고 vLLM·TensorRT-LLM·OpenClaw 같은 도구 체인과 결합했을 때 실전 이득이 얼마나 큰지가 핵심이다. 만약 숫자가 유지된다면, 이번 트윗은 멀티모달 에이전트를 여러 모델 묶음에서 단일 인식 계층으로 재편하려는 흐름의 기준점이 될 수 있다. 출처: NVIDIA AI 원문 트윗 · 공식 기술 블로그

Share: Long

Related Articles

LLM sources.twitter Mar 25, 2026 1 min read

NVIDIA는 2026년 3월 25일 Nemotron Nano 12B v2 VL이 온프레미스 video understanding을 지원하며, 자사 설명 기준으로 MediaPerf benchmark에서 30B급 대안에 가까운 성능을 더 작은 footprint로 낸다고 밝혔다. NVIDIA 모델 카드는 이를 multi-image reasoning, video understanding, visual Q&A, summarization을 위한 상용 가능 멀티모달 모델로 소개한다.

LLM sources.twitter Apr 12, 2026 1 min read

NVIDIA AI PC는 2026년 4월 2일 X에서 Gemma 4 모델군이 RTX GPU와 DGX Spark에 최적화됐고, 특히 26B와 31B가 local agentic AI에 적합하다고 밝혔다. NVIDIA 공식 blog는 이 협업이 RTX PC, workstation, DGX Spark, Jetson Orin Nano, data center 배포까지 아우르며, native tool use, multimodal input, Ollama와 llama.cpp 기반 local runtime 지원을 제공한다고 설명한다.

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.