NVIDIA、720p・1分動画生成可能な2.6Bオープンソース世界モデル「SANA-WM」を公開
Original: SANA-WM, a 2.6B open-source world model for 1-minute 720p video View original →
SANA-WMとは
NVIDIA LabsがSANA-WM(Efficient Minute-Scale World Modeling)を公開した。2.6Bパラメータのこのオープンソースモデルは、最大1分・720p解像度の動画を生成できる。Hacker Newsで172票を獲得した。
注目される理由
既存の動画生成モデルは数秒〜数十秒の低解像度に留まるか、高品質動画に膨大な計算資源を必要とすることが多かった。SANA-WMは2.6Bという比較的小さなパラメータ数で1分・720pを実現した点で、効率面の突破口と評価される。
世界モデルとしての意義
単なる動画生成を超えた「世界モデル」という位置づけは、物理世界の因果関係や動力学をシミュレートしようとする方向性を示す。ロボット訓練、シミュレーション環境構築、インタラクティブアプリケーションなど幅広い用途が期待される。
オープンソース公開の意義
NVIDIA がSANA-WMをオープンソースとして公開したことで、動画生成研究のアクセシビリティが向上する。OpenAIのSoraやGoogleのVeoなどのクローズドソースモデルに対するオープンソース代替エコシステムの強化に貢献する。
Related Articles
AI動画生成スタートアップRunwayがGeneral Atlantic主導の$315M投資を獲得し、評価額が$5.3Bに上昇。ワールドモデルGWM-1とGen-4.5でロボット・映像生成市場を攻略する。
NVIDIA AIが、30B・23B・12Bの推論モデルを1つのチェックポイントに統合した「Star Elastic」を公開。ゼロショットスライシングにより、別途ダウンロードなしにモデル規模を動的に切り替えられる。
NVIDIAが4月28日に30BパラメータのマルチモーダルオープンモデルNemotron 3 Nano Omniを公開。視覚・音声・言語を単一モデルで処理し、同クラスオープンモデルより9倍高いスループットを実現。
Comments (0)
No comments yet. Be the first to comment!