앤스로픽 연구: 실사용 환경에서 AI 에이전트 자율성이 빠르게 증가 중

AI 에이전트 자율성의 현주소

앤스로픽은 2026년 2월 19일, 클로드 코드(Claude Code)와 공개 API를 통한 수백만 건의 실제 상호작용을 분석하여 AI 에이전트 자율성 실태를 실증적으로 측정한 연구를 발표했습니다.

2025년 10월부터 2026년 1월 사이, 99.9번째 백분위 턴 지속 시간이 25분 미만에서 45분 이상으로 거의 두 배 증가했습니다. 연구진은 "현존 모델들이 실제로 사용되는 것보다 더 많은 자율성을 처리할 능력이 있다"고 결론지었습니다.

신규 사용자는 약 20%의 작업을 자율 승인하는 반면, 숙련된 사용자는 약 40%를 자율 승인합니다. 흥미롭게도 숙련 사용자는 개별 작업 승인 방식에서 전체 세션 모니터링 방식으로 전환하면서 실제 개입도 더 자주 합니다.

공개 API에서 에이전트 활동의 약 50%가 소프트웨어 공학 분야이며, 의료·금융·고객 서비스 분야에서도 신흥 활용이 나타나고 있습니다.

대부분의 작업(80%)은 권한 요청이나 인간 검토와 같은 안전 장치가 적용되며, 0.8%만이 되돌릴 수 없는 작업입니다. 연구팀은 에이전트가 고위험 도메인으로 확장됨에 따라 배포 후 모니터링 인프라 구축이 중요해질 것이라고 권고합니다.

전체 연구는 앤스로픽 연구 페이지에서 확인할 수 있습니다.

AI X/Twitter Jul 15, 2026 1 min read

Anthropic이 캐나다 AI 연구기관에 1,000만 CAD 규모 지원을 배정했다. Amii, Mila, Vector와 의료·대학 기관까지 포함돼 Claude 활용 범위가 연구와 공공 영역으로 넓어진다.

AI Reddit Feb 19, 2026 1 min read

r/singularity에서 주목받은 Anthropic의 2026-02-18 연구는 Claude Code와 public API의 대규모 상호작용 데이터를 바탕으로, 자율 실행 시간·auto-approve 패턴·위험 도메인 분포를 정량적으로 제시했다.

AI X/Twitter Mar 23, 2026 1 min read

Anthropic는 3월 18일 X에서 약 8만1천 명의 Claude 사용자가 참여한 1주일짜리 qualitative interview study를 공개했다. 실제 사용자가 AI에서 무엇을 원하고 무엇을 우려하는지 보여주는 드문 대규모 1차 자료다.