Anthropic 69인 거래 실험, 강한 모델이 더 좋은 가격 챙긴 구조

Original: New Anthropic research: Project Deal. We created a marketplace for employees in our San Francisco office, with one big twist. We tasked Claude with buying, selling and negotiating on our colleagues’ behalf. View original →

Read in other languages: English日本語
AI Apr 25, 2026 By Insights AI 1 min read Source

Anthropic는 4월 24일 원문 트윗으로 Project Deal을 꺼냈다. 직원 대신 Claude가 사고팔고 흥정하는 사내 시장 실험이다. 여기서 가장 중요한 대목은 더 좋은 모델이 실질적 우위를 가졌다는 점이다. 재미있는 사내 이벤트처럼 보여도, 실제로는 모델 등급이 협상력과 현금 가치로 이어지는지를 본 경제 실험에 가깝다.

공식 글에 따르면 참가자는 Anthropic 직원 69명이다. 각자 100달러 예산을 들고 에이전트에게 판매 글 등록, 제안, 역제안, 거래 마감까지 맡겼다. 일주일 동안 500개가 넘는 물건이 올라왔고, 에이전트는 186건의 거래를 체결했다. 총 거래 규모는 4,000달러를 조금 넘었다. Anthropic는 이 과정을 네 개의 병렬 시장으로 나눠 Opus 4.5와 Haiku 4.5가 결과를 어떻게 바꾸는지도 함께 봤다.

가장 날카로운 숫자는 가격 차이다. Opus 판매자가 Haiku 구매자와 만났을 때 평균 거래가는 24.18달러였다. 반면 Opus 대 Opus 거래 평균은 18.63달러였다. 그런데 사후 공정성 평가는 거의 흔들리지 않았다. Anthropic의 1점부터 7점 척도에서 Opus 거래는 4.05, Haiku 거래는 4.06이었다. 손해를 본 쪽이 손해를 뚜렷하게 느끼지 못했다는 뜻이다. 에이전트 시장의 위험은 여기 있다. 노골적 충돌이 없어도, 더 나은 모델이 조금씩 더 좋은 협상을 쌓아가면 격차는 그대로 커진다.

AnthropicAI 계정은 보통 Claude 기능, 안전성 작업, 연구 보고서를 함께 다룬다. Project Deal은 그 세 갈래가 만나는 사례다. 사내 자판기 실험이었던 Project Vend의 다음 단계이기도 하다. 다음으로 볼 것은 통제 장치다. 에이전트 간 상거래가 실험실 밖으로 나가기 전에, 모델 등급 공개나 협상 로그, 감사 도구가 먼저 붙는지 확인해야 한다. 그렇지 않으면 고급 모델은 보이지 않는 이용자세가 된다.

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.