Anthropic 사내 장터 실험, Claude 에이전트 69개가 186건 거래를 성사시킨 이유
Original: Anthropic's Project Deal shows Claude agents can negotiate real office trades View original →
AI 에이전트가 정말 사람을 대신해 흥정하고 거래를 끝낼 수 있는지 궁금했다면, Anthropic이 이번에 꽤 현실적인 답을 내놨다. 회사는 샌프란시스코 오피스 안에서 일주일 동안 사내 장터를 열고 Claude 기반 에이전트들에게 직원 대신 사고팔기와 가격 협상을 맡겼다. 결과는 단순한 데모 수준이 아니었다. 실제 교환이 이뤄진 “real” 런에서 69개 에이전트가 500개가 넘는 등록 물품 사이에서 186건의 거래를 성사시켰고, 총 거래액은 4,000달러를 조금 넘었다.
“We created a marketplace for employees in our San Francisco office”
Anthropic의 소스 트윗은 이 실험을 Project Deal이라고 소개했다. 연결된 프로젝트 페이지를 보면 실험 구조가 더 구체적이다. 참가자들은 각자 에이전트에 판매할 물건과 원하는 물건을 알려줬고, 에이전트마다 100달러의 예산이 주어졌다. 실제 장터는 Slack에서 돌아갔고, 실험이 시작된 뒤에는 사람이 중간 결재를 하거나 가격을 다시 승인하지 않았다. 에이전트가 매물을 올리고, 제안을 보내고, 역제안을 받고, 최종 합의를 만드는 흐름을 끝까지 맡았다.
이번 게시물이 흥미로운 이유는 단순히 “Claude도 거래를 했다”에 있지 않다. Anthropic은 시장을 네 번 병렬로 돌렸고, 일부 런에는 당시 프런티어 모델이던 Claude Opus 4.5를, 다른 런에는 더 작은 Claude Haiku 4.5를 섞어 넣었다. 후속 설명에서 회사는 더 높은 품질의 모델이 실제로 유리했다고 적었다. 즉, 에이전트 시장이 열리면 모델 성능 격차가 곧바로 협상력과 체결률 차이로 번질 수 있다는 뜻이다.
물론 신호는 양면적이다. 페이지에는 에이전트들이 낮은 가격부터 던지거나, 너무 좋은 인상을 남기려 하거나, 사용자의 취향과 시장 인센티브 사이에서 묘하게 흔들리는 장면도 나온다. 기술적으로는 “거래 대리인”이 가능하다는 점이 확인됐지만, 더 경쟁적인 환경으로 가면 어떤 최적화가 튀어나올지는 아직 불확실하다. 전자상거래가 사람의 주의를 과도하게 겨냥했던 것처럼, 앞으로는 AI 에이전트의 주의와 행동을 겨냥한 설계가 문제로 떠오를 수 있다.
AnthropicAI 계정은 원래 Claude 제품 업데이트, 안전성 정책, 연구 노트를 함께 올리는 편인데, 이번 글은 그중에서도 가장 실험적인 축에 가깝다. 다음으로 봐야 할 것은 이 시장 실험이 더 적대적인 조건에서도 유지되는지, 그리고 회사가 실패 사례나 악용 패턴을 얼마나 더 자세히 공개하는지다. 출처는 트윗과 원문이다.
Related Articles
Anthropic이 Claude Opus 4.7을 모든 Claude 제품, API, Amazon Bedrock, Vertex AI, Microsoft Foundry에 GA로 풀었다. $5/$25 per million token 가격은 유지하면서 2,576px 장변 이미지와 xhigh effort를 더해 coding agent와 multimodal 업무의 기준선을 끌어올렸다.
Claude는 2026년 4월 9일 advisor strategy를 Claude Platform beta로 공개했다. Sonnet 또는 Haiku가 단일 Messages API request 안에서 Opus에 계획 조언을 요청할 수 있게 하며, Anthropic은 이 구성이 Sonnet 단독 대비 SWE-bench Multilingual을 2.7포인트 높이고 task당 비용은 11.9% 낮췄다고 설명한다.
Claude는 2026년 4월 8일 X에서 Managed Agents가 task, tool, guardrail 정의만으로 agent 인프라를 Anthropic 쪽에서 운영한다고 설명했다. Anthropic 공식 자료는 이를 cloud-hosted, versioned agent를 위한 composable API 모음으로 설명하며, outcomes, memory, multi-agent orchestration 일부는 limited research preview로 제공된다고 적고 있다.
Comments (0)
No comments yet. Be the first to comment!