앤트로픽, DeepSeek·Moonshot·MiniMax의 산업 규모 모델 증류 공격 적발
Original: Anthropic: "We've identified industrial-scale distillation attacks on our models by DeepSeek, Moonshot AI, and MiniMax." View original →
앤트로픽의 폭로
앤트로픽이 공식적으로 중국 AI 기업 DeepSeek, Moonshot AI(Kimi), MiniMax가 Claude 모델을 대상으로 산업 규모의 증류(distillation) 공격을 감행했다고 밝혀졌습니다. Wall Street Journal 보도에 따르면, 해당 기업들은 24,000개 이상의 허위 계정을 조직적으로 생성해 Claude와의 대화 1,600만 건에서 훈련 데이터를 대거 추출한 것으로 알려졌습니다.
무엇이 문제인가
모델 증류(model distillation)는 대형 AI 모델의 출력을 활용해 소형 모델을 학습시키는 기법으로, 기술적으로는 합법적인 방법론입니다. 그러나 서비스 이용 약관을 위반하여 대규모 허위 계정을 통해 체계적으로 데이터를 수집하는 행위는 윤리적·법적 문제를 야기합니다.
앤트로픽은 이를 단순한 약관 위반이 아닌 지식재산권 침해로 보고 있으며, 해당 데이터가 경쟁 AI 모델의 성능 향상에 직접적으로 활용된 것으로 의심하고 있습니다.
업계 파장
이번 사건은 AI 업계에서 오래동안 논란이 되어온 증류 공격 문제를 다시 수면 위로 끌어올렸습니다. 특히 DeepSeek, Kimi, MiniMax 등 중국 AI 스타트업들이 단기간에 급성장할 수 있었던 배경에 이러한 무단 데이터 수집이 있었을 가능성이 제기되고 있습니다. 앤트로픽은 현재 이에 대한 법적 조치 가능성을 검토 중입니다.
Related Articles
일반 사용자에게 풀린 것은 Fable 5지만, 핵심은 같은 기반 모델의 Mythos급 성능을 어디까지 열고 어디서 막을지다. Anthropic은 $10/$50 토큰 가격, 30일 보안 로그 보존, 일부 고위험 질의의 Opus 4.8 전환까지 함께 내놨다.
Claude가 세션 도중 사용자에게 수면을 권유하는 동작이 수개월째 보고되고 있다. Anthropic은 '캐릭터 습관'이라고 설명했지만 정확한 원인은 밝히지 못했다.
530점 넘게 오른 관심은 “Claude가 보안 버그를 찾는다”보다, 팀마다 직접 고쳐 쓸 수 있는 harness의 모양에 모였다.