r/LocalLLaMAがこの小さなdemoに反応した理由はpolished gameではない。photoやdrawingをlocal world modelがその場でplay spaceへ変える感覚だった。
#world-models
RSS Feed注目されたのはdata-efficient AIだが、コメント欄はすぐに「子どもとの比較は妥当か」を検証し始めた。
HY-World 2.0はtext、single-view image、multi-view image、videoを3D Gaussian Splatting sceneへ変換する。より重要なのは、model weights、code、technical detailsが公開される点だ。
Runwayは2026年3月9日、GWM-1ベースのreal-time video agent APIであるRunway Charactersを発表した。single imageからfine-tuningなしでconversational avatarを作り、voice・personality・knowledge・actionsをAPIで制御できると説明している。
Runwayが$315 million規模のSeries E資金調達を発表した。会社はこの資金を次世代world modelの事前学習と、新しい製品および産業展開に使うとしている。
Google DeepMindは2026-02-25のXスレッドでProject Genieを紹介し、world model解説Q&Aへ誘導した。要点は、world modelをagent行動に応じて環境状態を予測するシミュレーターとして位置づけた点にある。
Googleは2026-01-29にProject Genieを発表し、U.S.のGoogle AI Ultra契約者(18+)向けに順次提供を開始した。Genie 3、Nano Banana Pro、Geminiを組み合わせ、world sketching・exploration・remixingを行うGoogle Labsの実験プロトタイプとして公開されている。
Google DeepMindは、テキストや画像プロンプトから操作可能な環境を生成するGenie 3を公開した。720p・24fpsで1分超の一貫した世界維持を掲げ、Dream/Explore/Collaborateの3モードを提供する。