NVIDIA의 Nemotron 3 Super는 120B total / 12B active hybrid Mamba-Transformer MoE, native 1M-token context, 그리고 open weights·datasets·recipes를 함께 내세운다. LocalLLaMA discussion은 이 openness와 efficiency claim이 실제 home-lab deployment로 이어질 수 있는지에 집중했다.
#nvidia
NVIDIA AI Developer는 2026년 3월 11일 Nemotron 3 Super를 공개하며, 12B active parameters를 사용하는 오픈 120B-parameter hybrid MoE 모델과 native 1M-token context를 강조했다. NVIDIA는 이 모델이 이전 Nemotron Super 대비 최대 5배 높은 throughput으로 agentic workload를 겨냥한다고 설명했다.
NVIDIAAI는 Thinking Machines와 협력해 frontier AI model training용으로 최소 1 gigawatt 규모의 NVIDIA Vera Rubin system을 배치하겠다고 밝혔다. Thinking Machines는 이 인프라가 customizable AI를 제공하는 platform까지 뒷받침할 것이라고 설명했다.
ABB Robotics와 NVIDIA는 Omniverse libraries를 RobotStudio에 통합해 RobotStudio HyperReality를 2026년 하반기에 출시할 계획이라고 밝혔다. 양사는 99% sim-to-real 상관도와 최대 40% deployment cost 절감, 최대 50% time-to-market 개선을 기대한다고 설명했다.
OpenAI는 2026년 2월 27일 $110B 신규 투자와 Amazon·NVIDIA 협력 확대를 발표했다. 회사는 이를 900M 주간 ChatGPT 사용자, 9 million 유료 비즈니스 사용자, 그리고 빠르게 늘어나는 Codex 수요에 대응하기 위한 조치로 설명했다.
NVIDIA는 주요 통신사와 장비 기업들이 open and secure AI-native platforms를 기반으로 6G를 구축하기로 했다고 밝혔다. 이번 연합은 6G 경쟁을 radios와 spectrum만의 문제가 아니라 programmable AI infrastructure 경쟁으로 확장한다.
NVIDIA는 최신 헬스케어·생명과학 AI 설문을 통해 업계가 실험 단계를 넘어 ROI 중심 운영으로 이동하고 있다고 밝혔다. 회사는 응답 조직의 70%가 이미 AI를 사용 중이며, 69%가 generative AI와 LLM을 활용한다고 설명했다.
r/LocalLLaMA에서 주목받은 FlashAttention-4는 B200 BF16에서 최대 1605 TFLOPs/s를 제시하며, Blackwell의 메모리·SFU 병목을 겨냥한 파이프라인 개선을 소개했다.
NVIDIA는 2026년 2월 28일 MWC에서 주요 통신·인프라 기업들과 AI-native 6G 구축 협력을 발표했다. 발표에는 개방형 소프트웨어 정의 네트워크와 신뢰 가능한 공급망 원칙이 포함됐다.
NVIDIA와 Coherent는 2026년 3월 2일 차세대 AI 데이터센터용 광학 기술 협력을 발표했다. NVIDIA는 Coherent에 20억 달러를 투자하고 다년간 공급·R&D 협력을 확대한다.
r/pcgaming에서 주목받은 PCWorld 기사에 따르면 Jon Peddie Research 기준으로 Nvidia가 PC 외장 GPU 시장 90% 이상을 차지했고 AMD는 10% 미만으로 내려갔다.
NVIDIA는 Lumentum과 다년 전략 계약을 체결하고 고급 광학 기술 협력을 확대한다고 밝혔다. 비독점 계약에는 다년 구매 약정과 함께 NVIDIA의 20억 달러 투자 계획이 포함됐다. 목표는 차세대 AI 인프라와 데이터센터용 광학 상호연결 기술 고도화다.