NAVERはGAK Sejongを55MW規模へ広げ、将来的にはギガワット級AIファクトリーを目指す。NVIDIAの投稿は、DSXを主権AI、HyperCLOVA X、エージェント型サービスの基盤として位置づけた。
NAVERはGAK Sejongを55MW規模へ広げ、将来的にはギガワット級AIファクトリーを目指す。NVIDIAの投稿は、DSXを主権AI、HyperCLOVA X、エージェント型サービスの基盤として位置づけた。
オープンモデル競争は順位表だけでなく、長時間エージェントの運用コストへ移っている。NVIDIAはNemotron 3 Ultraについて、5倍高速な推論と最大30%低い複雑タスク費用を示した。
NVIDIAはOmniverse、Cosmos、Isaac、Metropolis、Alpamayo、Jetsonをagent-callableなopen source physical AI skillとして公開した。Pegatron 67%、Delta 17%、Foxconn 3%など製造現場の数値も示された。
NVIDIA Veraはfull productionに入り、x86 CPU比でtask completionを1.8倍にすると説明された。OpenAI、Anthropic、SpaceXAI、ByteDance、CoreWeave、OCIなどが採用・評価先として挙がる。
NVIDIAはCosmos 3を物理AI向けのオープンomnimodelとして公開した。SuperとNanoに加え、6種類の合成データセット、Hugging Faceチェックポイント、GitHubレシピが示された。
NVIDIAのopen humanoid reference designは、Unitree H2 Plus、Sharpaの5本指ハンド、Jetson AGX Thor T5000を統合する。75自由度と2,070 FP4 TFLOPSの構成で、研究室間の比較可能性を高める狙いだ。
NVIDIAは550BパラメータのMoEモデルを、Agent ToolkitやOpenShellと一体で打ち出した。最大5倍の推論速度、最大30%のコスト低下、6月4日の提供開始が焦点になる。
NVIDIAはLLM推論スタックの設定探索を実機投入前に絞り込むDynoSimを示した。技術ブログでは23,608件のリクエスト、60.1分のserving windowを2.41秒で再現した例が示されている。
LLM inferenceで高いのはGPUだけでなく、実験そのものだ。NVIDIAはDynoSimが23,608 requestのtraceをApple M4 MacBook Air上で2.41秒で再生し、60.1分のserving windowを約1,500倍速で模擬したと示した。
NVIDIA Labsが、最大1分・720p解像度の動画を生成できる2.6Bパラメータのオープンソース世界モデル「SANA-WM」を公開した。比較的小さなモデルサイズとオープンソース公開が動画生成研究のアクセシビリティを高める。
Anthropicは2026年5月6日、SpaceX-xAIのColossus 1データセンターの全コンピューティングを独占利用する契約を締結した。22万台以上のNVIDIA GPUと300MWの処理能力を確保し、Claude APIの利用制限も大幅に緩和される。
NVIDIA AIが、30B・23B・12Bの推論モデルを1つのチェックポイントに統合した「Star Elastic」を公開。ゼロショットスライシングにより、別途ダウンロードなしにモデル規模を動的に切り替えられる。