Anthropic 69인 거래 실험, 강한 모델이 더 좋은 가격 챙긴 구조
Original: New Anthropic research: Project Deal. We created a marketplace for employees in our San Francisco office, with one big twist. We tasked Claude with buying, selling and negotiating on our colleagues’ behalf. View original →
Anthropic는 4월 24일 원문 트윗으로 Project Deal을 꺼냈다. 직원 대신 Claude가 사고팔고 흥정하는 사내 시장 실험이다. 여기서 가장 중요한 대목은 더 좋은 모델이 실질적 우위를 가졌다는 점이다. 재미있는 사내 이벤트처럼 보여도, 실제로는 모델 등급이 협상력과 현금 가치로 이어지는지를 본 경제 실험에 가깝다.
공식 글에 따르면 참가자는 Anthropic 직원 69명이다. 각자 100달러 예산을 들고 에이전트에게 판매 글 등록, 제안, 역제안, 거래 마감까지 맡겼다. 일주일 동안 500개가 넘는 물건이 올라왔고, 에이전트는 186건의 거래를 체결했다. 총 거래 규모는 4,000달러를 조금 넘었다. Anthropic는 이 과정을 네 개의 병렬 시장으로 나눠 Opus 4.5와 Haiku 4.5가 결과를 어떻게 바꾸는지도 함께 봤다.
가장 날카로운 숫자는 가격 차이다. Opus 판매자가 Haiku 구매자와 만났을 때 평균 거래가는 24.18달러였다. 반면 Opus 대 Opus 거래 평균은 18.63달러였다. 그런데 사후 공정성 평가는 거의 흔들리지 않았다. Anthropic의 1점부터 7점 척도에서 Opus 거래는 4.05, Haiku 거래는 4.06이었다. 손해를 본 쪽이 손해를 뚜렷하게 느끼지 못했다는 뜻이다. 에이전트 시장의 위험은 여기 있다. 노골적 충돌이 없어도, 더 나은 모델이 조금씩 더 좋은 협상을 쌓아가면 격차는 그대로 커진다.
AnthropicAI 계정은 보통 Claude 기능, 안전성 작업, 연구 보고서를 함께 다룬다. Project Deal은 그 세 갈래가 만나는 사례다. 사내 자판기 실험이었던 Project Vend의 다음 단계이기도 하다. 다음으로 볼 것은 통제 장치다. 에이전트 간 상거래가 실험실 밖으로 나가기 전에, 모델 등급 공개나 협상 로그, 감사 도구가 먼저 붙는지 확인해야 한다. 그렇지 않으면 고급 모델은 보이지 않는 이용자세가 된다.
Related Articles
Anthropic이 Claude Design을 research preview로 열며 Opus 4.7을 prototype, slide, one-pager 제작 workflow에 붙였다. Pro, Max, Team, Enterprise 사용자는 design system 자동 적용, Canva/PPTX/PDF export, Claude Code handoff까지 한 화면에서 테스트하게 된다.
중요한 점은 Anthropic이 Claude를 법무, 금융, 정책 문서가 실제로 오가는 Word 작업면에 넣었다는 데 있다. beta는 Pro, Max, Team, Enterprise 사용자를 포함하고, 수정 내용은 Word native tracked changes로 남는다.
중요한 점은 Anthropic이 Claude를 텍스트와 코드뿐 아니라 시각적 작업물 생성으로 넓히고 있다는 데 있다. 트윗은 Claude Design이 Opus 4.7 기반이며 Pro, Max, Team, Enterprise plan에 research preview로 배포된다고 밝혔다.
Comments (0)
No comments yet. Be the first to comment!