Allen AI, 로봇 기초 모델 MolmoAct 2 오픈소스 공개—π0.5 능가
Allen Institute for AI(Ai2)가 5월 5일 로봇 기초 모델 MolmoAct 2를 완전 오픈소스로 공개했다. 모델 가중치·학습 코드·전체 학습 데이터가 동시에 공개됐으며, Physical Intelligence의 유료 모델 π0.5를 시뮬레이션 및 실제 환경 작업에서 능가했다.
성능
7B 파라미터 모델로 Molmo LLM을 기반으로 한다. 실제 환경 DROID 태스크에서 제로샷 기준 최대 87.1% 성공률을 달성했다.
- 사과→접시 이동: 100% 성공
- 피펫→트레이 이동: 86.7% 성공
- 다중 단계 물체 이동: 62% 성공
아키텍처
Molmo 2-ER 비전-언어 모델과 플로우 매칭(flow matching) 기반 전용 액션 전문가를 KV 캐시 브리지로 연결한 구조다. 이 설계로 추론 속도가 기존 대비 37배 향상됐다.
데이터셋
학습에는 실제 환경에서 수집한 1만 2,000개의 로봇 에피소드가 사용됐다. Ai2는 양손 조작 전용 데이터셋 MolmoAct 2-Bimanual YAM(700시간 이상 조작 시연 포함)도 함께 공개했다.
자세한 내용은 Ai2 공식 블로그에서 확인할 수 있다.
Related Articles
메이커 Aaed Musa가 자작 로봇 강아지 CARA 2.0을 공개했다. 1세대 대비 기구학적 개선과 안정성 향상을 이뤄낸 오픈소스 사족보행 로봇 프로젝트다.
와이어드가 Eka의 로봇 집게 발 기술을 조명하며 물리적 조작 능력이 텍스트 AI의 ChatGPT 등장처럼 임계점에 근접했다고 분석했다.
Figure AI가 BotQ 공장에서 Figure 03 휴머노이드 로봇을 시간당 1대 생산하는 이정표를 달성했다. 하루 1대였던 1월에서 4개월 만에 24배 늘어난 수치로, 350대 이상이 납품됩다.
Comments (0)
No comments yet. Be the first to comment!