앤트로픽, DeepSeek·Moonshot·MiniMax의 산업 규모 모델 증류 공격 적발
Original: Anthropic: "We've identified industrial-scale distillation attacks on our models by DeepSeek, Moonshot AI, and MiniMax." View original →
앤트로픽의 폭로
앤트로픽이 공식적으로 중국 AI 기업 DeepSeek, Moonshot AI(Kimi), MiniMax가 Claude 모델을 대상으로 산업 규모의 증류(distillation) 공격을 감행했다고 밝혀졌습니다. Wall Street Journal 보도에 따르면, 해당 기업들은 24,000개 이상의 허위 계정을 조직적으로 생성해 Claude와의 대화 1,600만 건에서 훈련 데이터를 대거 추출한 것으로 알려졌습니다.
무엇이 문제인가
모델 증류(model distillation)는 대형 AI 모델의 출력을 활용해 소형 모델을 학습시키는 기법으로, 기술적으로는 합법적인 방법론입니다. 그러나 서비스 이용 약관을 위반하여 대규모 허위 계정을 통해 체계적으로 데이터를 수집하는 행위는 윤리적·법적 문제를 야기합니다.
앤트로픽은 이를 단순한 약관 위반이 아닌 지식재산권 침해로 보고 있으며, 해당 데이터가 경쟁 AI 모델의 성능 향상에 직접적으로 활용된 것으로 의심하고 있습니다.
업계 파장
이번 사건은 AI 업계에서 오래동안 논란이 되어온 증류 공격 문제를 다시 수면 위로 끌어올렸습니다. 특히 DeepSeek, Kimi, MiniMax 등 중국 AI 스타트업들이 단기간에 급성장할 수 있었던 배경에 이러한 무단 데이터 수집이 있었을 가능성이 제기되고 있습니다. 앤트로픽은 현재 이에 대한 법적 조치 가능성을 검토 중입니다.
Related Articles
HN은 이번 스레드를 단순한 모델 공개로 보지 않았다. API 문서보다 먼저 Hugging Face 가중치와 base 모델이 모습을 드러내자, 커뮤니티의 관심은 홍보보다 실물 검증으로 곧장 옮겨갔다.
Anthropic는 2026년 4월 7일 Claude Mythos Preview의 security 평가를 공개하며 major OS와 browser 전반의 zero-day 탐지·exploit 능력을 강조했다. Hacker News에서는 frontier LLM이 defensive tooling과 offensive risk를 동시에 밀어올리는 전환점으로 읽히고 있다.
Anthropic의 새 interpretability 연구는 Claude Sonnet 4.5 내부의 감정 관련 표현이 특히 스트레스 상황에서 행동을 바꾸는 인과적 역할을 한다고 주장한다.
Comments (0)
No comments yet. Be the first to comment!