r/LocalLLaMA가 이 작은 demo에 반응한 이유는 polished game이 아니라, photo와 drawing을 local world model이 즉석에서 play space로 바꾸는 감각이었다.
#world-models
RSS Feedr/MachineLearning의 관심은 “적은 데이터로 배우는 AI”였지만, 댓글은 곧바로 child comparison의 전제를 검증하기 시작했다.
HY-World 2.0은 text, single-view image, multi-view image, video를 3D Gaussian Splatting scene으로 바꾼다. 더 중요한 신호는 model weights, code, technical details가 공개됐다는 점이다.
Google DeepMind는 2026년 1월 22일 D4RT를 공개하며 dynamic 4D scene reconstruction and tracking을 하나의 AI model로 통합했다. 회사는 이 모델이 기존 방법 대비 18배에서 300배 빠르고 robotics와 AR 같은 real-time use case에 적합하다고 설명했다.
Runway가 2026년 3월 9일 GWM-1 기반 real-time video agent API인 Runway Characters를 공개했다. single image만으로 fine-tuning 없이 conversational avatar를 만들고, voice·personality·knowledge·actions를 API로 제어할 수 있다고 설명했다.
Runway가 $315 million 규모의 Series E 투자를 유치했다. 회사는 이 자금을 차세대 world model 사전학습과 새로운 제품 및 산업 확장에 쓰겠다고 밝혔다.
Google DeepMind는 2026-02-25 X 스레드에서 Project Genie를 소개하며 world model Q&A를 연결했다. 발표의 핵심은 world model을 agent 행동에 반응하는 환경 시뮬레이터로 정의한 점이다.
Google은 2026-01-29 Project Genie를 발표하고 U.S.의 Google AI Ultra 구독자(18+) 대상으로 순차 제공을 시작했다. Genie 3·Nano Banana Pro·Gemini를 결합한 웹 프로토타입으로 world sketching, exploration, remixing 기능을 제공한다.
Google DeepMind가 텍스트·이미지 프롬프트로 생성된 환경을 실시간 상호작용할 수 있는 Genie 3를 발표했다. 720p, 24fps로 1분 이상 일관된 세계를 유지하며 Dream/Explore/Collaborate 모드를 제공한다.