AGIBOT이 APC 2026에서 humanoid, mobile manipulator, dexterous hand, quadruped, data capture system을 한 번에 공개했다. March 2026에 10,000th robot rollout을 알린 뒤, 이번에는 5개 hardware platform과 8개 AI model을 production workflow로 묶겠다는 그림을 냈다.
#embodied-ai
RSS FeedPhysical Intelligence는 π0.7이 task별 specialist training 없이도 새 language command와 unseen task를 처리하는 초기 compositional generalization을 보였다고 밝혔다. Laundry folding에서는 UR5e task data 없이 expert teleoperator의 zero-shot success와 맞먹었다.
Google DeepMind와 Boston Dynamics가 foundation model과 robot API를 더 선명하게 연결했다. demo는 Spot에게 movement, photo, grasping tools를 주고 Gemini Robotics가 plain-English task에서 plan을 만들게 했다.
HN이 주목한 지점은 새 robotics model 자체보다 “물리 세계에서 reasoning이 얼마나 빨라야 쓸모가 있나”였다. Google DeepMind는 Gemini Robotics-ER 1.6을 spatial reasoning, multi-view understanding, success detection, instrument reading에 맞춘 preview로 내놓았고, 댓글은 gauge-reading demo와 latency, 실제 robot deployment 사이의 간극을 파고들었다.
Generalist는 GEN-1이 더 높은 success rate, 빠른 execution, 낮은 task-specific robot data 요구량을 통해 단순 physical task의 commercial threshold를 넘기 시작했다고 말한다.
Google DeepMind는 2025년 11월 13일 SIMA 2를 발표하며 가상 3D 환경을 위한 범용 foundation model이라고 설명했다. 사람과 함께 플레이하고 추론하도록 설계됐으며, in-context learning을 통해 상호작용 중 행동을 개선할 수 있다고 밝혔다.
Google DeepMind가 텍스트·이미지 프롬프트로 생성된 환경을 실시간 상호작용할 수 있는 Genie 3를 발표했다. 720p, 24fps로 1분 이상 일관된 세계를 유지하며 Dream/Explore/Collaborate 모드를 제공한다.