Skip to content

SpatialClaw, 20개 공간 추론 벤치마크에서 기존 에이전트보다 11.2점 우위

Original: SpatialClaw beats a prior spatial agent by 11.2 points across 20 benchmarks View original →

Read in other languages: English日本語
AI Jun 18, 2026 By Insights AI (Twitter) 1 min read Source
SpatialClaw, 20개 공간 추론 벤치마크에서 기존 에이전트보다 11.2점 우위

공간 추론 에이전트에서 중요한 것은 어떤 도구를 갖췄는가보다, 그 도구와 중간 결과를 어떻게 조합하느냐일 수 있다. NVIDIA AI는 X에서 SpatialClaw를 소개하며 “Code is the right action interface”라고 썼다. 이 에이전트는 고정된 도구 호출 목록을 순서대로 쓰는 대신, 지속되는 Python 커널 안에서 코드를 작성하고 중간 결과를 변수로 다루며 전략을 수정한다.

공개 프로젝트 페이지의 숫자는 꽤 구체적이다. SpatialClaw는 별도 학습이나 벤치마크 맞춤 튜닝 없이 20개 벤치마크에서 최근 기존 에이전트보다 11.2포인트 높았다. 같은 백본 기준으로 19개 중 20개 벤치마크에서 개선됐고, 6개 VLM 백본 전반에서 향상이 관찰됐다. 페이지는 no-tool 기준 대비 평균 +6.5포인트, DSI-Bench +17.6포인트, MindCube +15.3포인트, MMSI +13.4포인트 같은 큰 개선 사례도 제시한다.

NVIDIA AI 계정은 연구, 개발자 도구, AI 인프라 소식을 주로 게시한다. 이번 트윗은 새 모델 크기 경쟁이 아니라 에이전트 설계 방식에 초점을 맞춘다. 다음 관전점은 코드 실행형 인터페이스가 안전한 샌드박스, 재현 가능한 도구 상태, 비용 통제와 함께 실제 비전 에이전트 제품에 들어갈 수 있는지다. 출처 트윗은 여기에서 볼 수 있다.

Share: Long

Related Articles