NAVER가 GAK 세종을 55MW 규모로 확장하고 장기적으로 기가와트급 AI 팩토리를 추진한다. NVIDIA Newsroom 게시물은 DSX 기반 주권 AI 인프라와 HyperCLOVA X 고도화를 핵심 축으로 제시했다.
NAVER가 GAK 세종을 55MW 규모로 확장하고 장기적으로 기가와트급 AI 팩토리를 추진한다. NVIDIA Newsroom 게시물은 DSX 기반 주권 AI 인프라와 HyperCLOVA X 고도화를 핵심 축으로 제시했다.
오픈 모델 경쟁이 단순 성능표에서 장시간 에이전트 비용으로 이동하고 있다. NVIDIA는 Nemotron 3 Ultra가 550B MoE 구조로 5배 빠른 추론과 최대 30% 낮은 복잡 작업 비용을 낸다고 밝혔다.
NVIDIA가 Omniverse, Cosmos, Isaac, Metropolis, Alpamayo를 agent가 호출할 수 있는 open source physical AI skill로 묶었다. Pegatron 67%, Delta 17%, Foxconn 3% 같은 제조 현장 수치가 함께 제시됐다.
NVIDIA Vera가 full production에 들어가며 agentic AI 인프라의 병목을 CPU 작업으로 끌어올렸다. OpenAI, Anthropic, SpaceXAI, ByteDance, CoreWeave 등이 도입 또는 평가 대상으로 언급됐고, x86 대비 1.8배 빠른 task completion이 핵심 수치다.
NVIDIA가 Cosmos 3 Super와 Nano를 공개하며 물리 AI용 오픈 omnimodel 경쟁을 키웠다. 기술 블로그는 6개 합성데이터 세트, Hugging Face 체크포인트, GitHub 학습 레시피를 함께 제시했다.
NVIDIA가 Unitree H2 Plus, Sharpa 5-finger hands, Jetson AGX Thor T5000을 묶은 open humanoid reference design을 공개했다. 75 degrees of freedom, 2,070 FP4 TFLOPS, 약 3시간 배터리가 연구실의 비교 가능한 humanoid 실험 기준을 겨냥한다.
NVIDIA가 GTC Taipei에서 550B 파라미터 MoE 모델 Nemotron 3 Ultra와 Agent Toolkit을 묶어 기업용 장시간 에이전트 스택을 전면에 세웠다. 공개 모델 대비 최대 5배 빠른 추론과 최대 30% 낮은 비용, 6월 4일 배포 일정이 핵심이다.
NVIDIA가 Dynamo serving stack을 빠르게 실험하는 DynoSim을 공개했다. 기술 블로그 기준 Apple M4 MacBook Air에서 23,608개 요청, 60.1분 분량 트래픽을 2.41초에 재현해 약 1,500배 빠른 시뮬레이션을 보였다.
LLM inference 운영에서 비싼 GPU 실험을 먼저 돌릴 필요가 줄어든다. NVIDIA DynoSim은 23,608개 request trace를 Apple M4 MacBook Air에서 2.41초에 재생하며 real time 대비 약 1,500배 빠른 serving simulation을 제시했다.
NVIDIA 연구팀이 최대 1분 길이의 720p 해상도 영상을 생성할 수 있는 2.6B 파라미터 오픈소스 월드 모델 SANA-WM을 공개했다. 상대적으로 작은 모델 크기와 오픈소스 공개가 특징이다.
Anthropic이 2026년 5월 6일 SpaceX-xAI의 콜로서스1 데이터센터 전체 컴퓨팅을 독점 임차하는 계약을 체결했다. NVIDIA GPU 22만 개, 300MW 규모로 Claude API 한도가 대폭 상향된다.
NVIDIA AI가 하나의 체크포인트에 30B, 23B, 12B 추론 모델을 담은 Star Elastic을 공개했다. 제로샷 슬라이싱으로 별도 다운로드 없이 모델 크기를 동적으로 조정할 수 있다.