SpatialClaw, 20개 공간 추론 벤치마크에서 기존 에이전트보다 11.2점 우위
Original: SpatialClaw beats a prior spatial agent by 11.2 points across 20 benchmarks View original →
공간 추론 에이전트에서 중요한 것은 어떤 도구를 갖췄는가보다, 그 도구와 중간 결과를 어떻게 조합하느냐일 수 있다. NVIDIA AI는 X에서 SpatialClaw를 소개하며 “Code is the right action interface”라고 썼다. 이 에이전트는 고정된 도구 호출 목록을 순서대로 쓰는 대신, 지속되는 Python 커널 안에서 코드를 작성하고 중간 결과를 변수로 다루며 전략을 수정한다.
공개 프로젝트 페이지의 숫자는 꽤 구체적이다. SpatialClaw는 별도 학습이나 벤치마크 맞춤 튜닝 없이 20개 벤치마크에서 최근 기존 에이전트보다 11.2포인트 높았다. 같은 백본 기준으로 19개 중 20개 벤치마크에서 개선됐고, 6개 VLM 백본 전반에서 향상이 관찰됐다. 페이지는 no-tool 기준 대비 평균 +6.5포인트, DSI-Bench +17.6포인트, MindCube +15.3포인트, MMSI +13.4포인트 같은 큰 개선 사례도 제시한다.
NVIDIA AI 계정은 연구, 개발자 도구, AI 인프라 소식을 주로 게시한다. 이번 트윗은 새 모델 크기 경쟁이 아니라 에이전트 설계 방식에 초점을 맞춘다. 다음 관전점은 코드 실행형 인터페이스가 안전한 샌드박스, 재현 가능한 도구 상태, 비용 통제와 함께 실제 비전 에이전트 제품에 들어갈 수 있는지다. 출처 트윗은 여기에서 볼 수 있다.
Related Articles
NVIDIA Vera가 full production에 들어가며 agentic AI 인프라의 병목을 CPU 작업으로 끌어올렸다. OpenAI, Anthropic, SpaceXAI, ByteDance, CoreWeave 등이 도입 또는 평가 대상으로 언급됐고, x86 대비 1.8배 빠른 task completion이 핵심 수치다.
실시간 캐릭터 애니메이션과 로봇 동작 생성이 같은 모델 구조로 묶였다. NVIDIA Research는 MotionBricks가 35만 개 이상 동작 클립을 단일 신경망 백본으로 처리하고 15,000 FPS를 낸다고 공개했다.
NVIDIA가 Hugging Face에 Nemotron-Personas-Korea를 공개했다. 한국 공공통계에 기반한 7 million synthetic personas는 agent localization이 번역뿐 아니라 지역, 존댓말, 직업, 공공 서비스 맥락까지 다뤄야 한다는 점을 보여준다.