Anthropic 사내 장터 실험, Claude 에이전트 69개가 186건 거래를 성사시킨 이유

AI 에이전트가 정말 사람을 대신해 흥정하고 거래를 끝낼 수 있는지 궁금했다면, Anthropic이 이번에 꽤 현실적인 답을 내놨다. 회사는 샌프란시스코 오피스 안에서 일주일 동안 사내 장터를 열고 Claude 기반 에이전트들에게 직원 대신 사고팔기와 가격 협상을 맡겼다. 결과는 단순한 데모 수준이 아니었다. 실제 교환이 이뤄진 “real” 런에서 69개 에이전트가 500개가 넘는 등록 물품 사이에서 186건의 거래를 성사시켰고, 총 거래액은 4,000달러를 조금 넘었다.

“We created a marketplace for employees in our San Francisco office”

Anthropic의 소스 트윗은 이 실험을 Project Deal이라고 소개했다. 연결된 프로젝트 페이지를 보면 실험 구조가 더 구체적이다. 참가자들은 각자 에이전트에 판매할 물건과 원하는 물건을 알려줬고, 에이전트마다 100달러의 예산이 주어졌다. 실제 장터는 Slack에서 돌아갔고, 실험이 시작된 뒤에는 사람이 중간 결재를 하거나 가격을 다시 승인하지 않았다. 에이전트가 매물을 올리고, 제안을 보내고, 역제안을 받고, 최종 합의를 만드는 흐름을 끝까지 맡았다.

이번 게시물이 흥미로운 이유는 단순히 “Claude도 거래를 했다”에 있지 않다. Anthropic은 시장을 네 번 병렬로 돌렸고, 일부 런에는 당시 프런티어 모델이던 Claude Opus 4.5를, 다른 런에는 더 작은 Claude Haiku 4.5를 섞어 넣었다. 후속 설명에서 회사는 더 높은 품질의 모델이 실제로 유리했다고 적었다. 즉, 에이전트 시장이 열리면 모델 성능 격차가 곧바로 협상력과 체결률 차이로 번질 수 있다는 뜻이다.

물론 신호는 양면적이다. 페이지에는 에이전트들이 낮은 가격부터 던지거나, 너무 좋은 인상을 남기려 하거나, 사용자의 취향과 시장 인센티브 사이에서 묘하게 흔들리는 장면도 나온다. 기술적으로는 “거래 대리인”이 가능하다는 점이 확인됐지만, 더 경쟁적인 환경으로 가면 어떤 최적화가 튀어나올지는 아직 불확실하다. 전자상거래가 사람의 주의를 과도하게 겨냥했던 것처럼, 앞으로는 AI 에이전트의 주의와 행동을 겨냥한 설계가 문제로 떠오를 수 있다.

AnthropicAI 계정은 원래 Claude 제품 업데이트, 안전성 정책, 연구 노트를 함께 올리는 편인데, 이번 글은 그중에서도 가장 실험적인 축에 가깝다. 다음으로 봐야 할 것은 이 시장 실험이 더 적대적인 조건에서도 유지되는지, 그리고 회사가 실패 사례나 악용 패턴을 얼마나 더 자세히 공개하는지다. 출처는 트윗과 원문이다.

Anthropic 사내 장터 실험, Claude 에이전트 69개가 186건 거래를 성사시킨 이유

Related Articles

Claude Sonnet 5, Opus급 agent 성능을 Free·Pro 기본 모델로

Claude Opus 5, Fable급 코딩 성능을 절반 가격대로 낮춘 일상형 고성능 모델

Anthropic, Claude Sonnet 4.6 공개... 1M token context와 agent workflow 강화

Related Articles

Claude Sonnet 5, Opus급 agent 성능을 Free·Pro 기본 모델로
LLM Jul 1, 2026 1 min read

Claude Opus 5, Fable급 코딩 성능을 절반 가격대로 낮춘 일상형 고성능 모델
일상형 고성능 모델 경쟁의 초점이 최고점보다 비용당 성능으로 옮겨갔다. Claude Opus 5는 Fable 5에 가까운 코딩·지식 작업 성능을 절반 가격으로 내세우며, API 가격은 입력 $5/M·출력 $25/M 토큰으로 책정됐다.

Anthropic, Claude Sonnet 4.6 공개... 1M token context와 agent workflow 강화
LLM Mar 25, 2026 1 min read