Reddit를 달군 Generalist GEN-1, 단순 robot task 99% success 주장
Original: Generalist | Introducing GEN-1 View original →
Generalist의 새 GEN-1 system을 다룬 r/singularity의 Reddit 글은 이번 크롤링 시점에 357 upvotes와 52 comments를 기록했다. pure language model launch가 아닌 embodied AI 소식으로서는 상당히 강한 community signal이다. 연결된 회사 블로그는 GEN-1이 단순 physical task에서 commercial하게 의미 있는 threshold를 넘기 시작했다고 주장하지만, 글에 담긴 수치는 회사가 직접 보고한 결과라는 점을 구분해서 볼 필요가 있다.
Generalist에 따르면 GEN-1은 이전 시스템이 64%를 기록한 작업들에서 평균 success rate를 99%까지 끌어올리고, 기존 state of the art보다 약 3x 빠르게 작업을 끝내며, 각 결과에 필요한 robot data도 약 1 hour 수준이라고 한다. 회사는 또한 더 큰 기반 모델이 half a million hours를 넘는 high-fidelity physical interaction data 위에서 처음부터 학습됐다고 설명한다.
블로그가 제시한 핵심 주장
- GEN-1은 real time으로 actions를 내보내는 large multimodal system으로 제시된다.
- 회사는 mastery를 reliability, speed, improvisation의 결합으로 정의한다.
- auto parts 분류, t-shirt 접기, robot vacuum 정비, blocks 포장, box 접기, phone 포장 같은 작업에서 긴 autonomous run이 가능하다고 주장한다.
- 기반 모델의 pretraining은 robot data에 의존하지 않고 wearable devices를 통해 수집한 대규모 human interaction data를 쓴다고 설명한다.
- 이 진전을 large language model의 scaling laws에 대응하는 robotics 버전으로 해석한다.
이 때문에 Reddit 스레드가 중요하다. community는 더 이상 lab demo의 wow factor만 보는 것이 아니라, embodied AI 회사들이 model scaling 서사를 반복 가능한 operational metrics로 바꿀 수 있는지를 시험하고 있다. 이용자들은 robot video의 인상뿐 아니라 보고된 success rate, data efficiency, commercialization claim이 실제 배치 단계로 넘어갈 만큼 충분한지도 함께 따지고 있다.
Insights 관점에서 GEN-1이 눈에 띄는 이유는 physical AI의 성과를 reliability, execution speed, recovery behavior가 함께 포함된 scorecard로 설명하려 하기 때문이다. Original source: GEN-1. Community thread: r/singularity discussion.
Related Articles
NVIDIA가 Omniverse, Cosmos, Isaac, Metropolis, Alpamayo를 agent가 호출할 수 있는 open source physical AI skill로 묶었다. Pegatron 67%, Delta 17%, Foxconn 3% 같은 제조 현장 수치가 함께 제시됐다.
NVIDIA가 Unitree H2 Plus, Sharpa 5-finger hands, Jetson AGX Thor T5000을 묶은 open humanoid reference design을 공개했다. 75 degrees of freedom, 2,070 FP4 TFLOPS, 약 3시간 배터리가 연구실의 비교 가능한 humanoid 실험 기준을 겨냥한다.
NVIDIA가 Cosmos 3 Super와 Nano를 공개하며 물리 AI용 오픈 omnimodel 경쟁을 키웠다. 기술 블로그는 6개 합성데이터 세트, Hugging Face 체크포인트, GitHub 학습 레시피를 함께 제시했다.