Allen AI, 로봇 기초 모델 MolmoAct 2 오픈소스 공개—π0.5 능가
Allen Institute for AI(Ai2)가 5월 5일 로봇 기초 모델 MolmoAct 2를 완전 오픈소스로 공개했다. 모델 가중치·학습 코드·전체 학습 데이터가 동시에 공개됐으며, Physical Intelligence의 유료 모델 π0.5를 시뮬레이션 및 실제 환경 작업에서 능가했다.
성능
7B 파라미터 모델로 Molmo LLM을 기반으로 한다. 실제 환경 DROID 태스크에서 제로샷 기준 최대 87.1% 성공률을 달성했다.
- 사과→접시 이동: 100% 성공
- 피펫→트레이 이동: 86.7% 성공
- 다중 단계 물체 이동: 62% 성공
아키텍처
Molmo 2-ER 비전-언어 모델과 플로우 매칭(flow matching) 기반 전용 액션 전문가를 KV 캐시 브리지로 연결한 구조다. 이 설계로 추론 속도가 기존 대비 37배 향상됐다.
데이터셋
학습에는 실제 환경에서 수집한 1만 2,000개의 로봇 에피소드가 사용됐다. Ai2는 양손 조작 전용 데이터셋 MolmoAct 2-Bimanual YAM(700시간 이상 조작 시연 포함)도 함께 공개했다.
자세한 내용은 Ai2 공식 블로그에서 확인할 수 있다.
Related Articles
NVIDIA가 Omniverse, Cosmos, Isaac, Metropolis, Alpamayo를 agent가 호출할 수 있는 open source physical AI skill로 묶었다. Pegatron 67%, Delta 17%, Foxconn 3% 같은 제조 현장 수치가 함께 제시됐다.
카네기멜론대와 Bosch AI가 미래 촉각 신호를 예측하는 'HTD' 모델을 발표했다. 시각 전용 기준선 대비 5가지 실제 작업에서 성공률이 90.9% 향상됐다.
Figure 내부의 로봇 보유 수가 처음으로 직원 수를 넘어섰다. Brett Adcock이 공유한 차트는 2026년 로봇 대수가 급격히 늘고, 인력 곡선은 수백 명대에서 완만해진 흐름을 보여준다.