#world-models

RSS 피드

AI Hacker News 2d ago 1 min read

FLUX 3, 영상·오디오·액션을 한 모델에 묶은 이유

시각 생성 모델 논의가 이미지 품질 비교를 넘어, 영상·소리·행동 예측을 같은 backbone에 넣을 수 있느냐로 옮겨갔다.

#flux #multimodal #video-generation

AI Reddit Jul 8, 2026 1 min read

Rocket League로 학습한 MIRA, multiplayer world model 실험의 관전점

r/MachineLearning에서 검증된 최신 글 중 연구 가치가 가장 분명했던 항목은 게임 데이터를 이용한 interactive world model이었다.

#world-models #rocket-league #simulation

AI X/Twitter Jul 6, 2026 1 min read

AdaJEPA, 1번의 gradient step으로 world model을 실행 중 현장 보정

로봇과 에이전트 계획에서 고정된 world model이 흔들리는 문제를 줄이는 연구다. AdaJEPA는 MPC 재계획마다 관측 전이를 이용해 1번의 gradient step과 최근 5개 전이 버퍼로 모델을 보정한다.

#world-models #robotics #research

Humanoid Robots Jun 18, 2026 1 min read

Qwen-Robot Suite, 보기에서 행동으로 넘어가는 로봇용 foundation model 묶음

Qwen이 로봇용 foundation model을 navigation, manipulation, world modeling 세 갈래로 묶었다. Qwen-RobotNav, Qwen-RobotManip, Qwen-RobotWorld는 physical AI의 병목을 “인식”에서 “행동”으로 옮겨 놓는 release다.

#qwen #robotics #embodied-ai

AI Reddit Apr 20, 2026 1 min read

iPad에서 도는 tiny world model game, LocalLLaMA는 local 생성 놀이의 손맛을 봤다

r/LocalLLaMA가 이 작은 demo에 반응한 이유는 polished game이 아니라, photo와 drawing을 local world model이 즉석에서 play space로 바꾸는 감각이었다.

#world-models #local-ai #ipad

Sciences Reddit Apr 19, 2026 1 min read

Zero-shot World Models 논문에 r/MachineLearning이 따진 것

r/MachineLearning의 관심은 “적은 데이터로 배우는 AI”였지만, 댓글은 곧바로 child comparison의 전제를 검증하기 시작했다.

#world-models #machine-learning #developmental-ai

AI Apr 17, 2026 1 min read

HY-World 2.0, 탐색 가능한 3D world model의 code와 weights를 열다

HY-World 2.0은 text, single-view image, multi-view image, video를 3D Gaussian Splatting scene으로 바꾼다. 더 중요한 신호는 model weights, code, technical details가 공개됐다는 점이다.

#world-models #3d #opensource

Humanoid Robots Mar 23, 2026 2 min read

Google DeepMind, D4RT 공개… 4D scene reconstruction을 최대 300배 효율화

Google DeepMind는 2026년 1월 22일 D4RT를 공개하며 dynamic 4D scene reconstruction and tracking을 하나의 AI model로 통합했다. 회사는 이 모델이 기존 방법 대비 18배에서 300배 빠르고 robotics와 AR 같은 real-time use case에 적합하다고 설명했다.

#deepmind #robotics #computer-vision

AI Mar 9, 2026 1 min read

Runway, GWM-1 기반 real-time video agent API 'Runway Characters' 공개

Runway가 2026년 3월 9일 GWM-1 기반 real-time video agent API인 Runway Characters를 공개했다. single image만으로 fine-tuning 없이 conversational avatar를 만들고, voice·personality·knowledge·actions를 API로 제어할 수 있다고 설명했다.

#runway #video-agents #avatars

AI Mar 8, 2026 1 min read

Runway, $315 million Series E 조달... 차세대 world model 사전학습에 투입

Runway가 $315 million 규모의 Series E 투자를 유치했다. 회사는 이 자금을 차세대 world model 사전학습과 새로운 제품 및 산업 확장에 쓰겠다고 밝혔다.

#runway #funding #world-models

AI X/Twitter Feb 26, 2026 1 min read

Google DeepMind, X에서 Project Genie와 world model 개념을 공개 설명

Google DeepMind는 2026-02-25 X 스레드에서 Project Genie를 소개하며 world model Q&A를 연결했다. 발표의 핵심은 world model을 agent 행동에 반응하는 환경 시뮬레이터로 정의한 점이다.

#google-deepmind #project-genie #world-models

AI Feb 21, 2026 1 min read

Google Project Genie 공개: U.S. Google AI Ultra 대상 인터랙티브 월드 모델 프로토타입

Google은 2026-01-29 Project Genie를 발표하고 U.S.의 Google AI Ultra 구독자(18+) 대상으로 순차 제공을 시작했다. Genie 3·Nano Banana Pro·Gemini를 결합한 웹 프로토타입으로 world sketching, exploration, remixing 기능을 제공한다.

#project-genie #world-models #google-labs