앤스로픽, 딥시크·문샷 AI·미니맥스의 대규모 모델 증류 공격 폭로
Original: Anthropic Exposes Industrial-Scale AI Model Distillation Attacks by DeepSeek, Moonshot AI, and MiniMax View original →
산업 규모의 AI 모델 증류 공격 발견
앤스로픽은 2026년 2월 24일, 중국의 주요 AI 기업들이 클로드(Claude) 모델을 대상으로 대규모 증류 공격을 진행해왔다고 공개했습니다. 딥시크(DeepSeek), 문샷 AI(Moonshot AI), 미니맥스(MiniMax)가 이번 공격의 주체로 지목되었습니다.
공격의 규모와 방법
이들 기업은 다음과 같은 방식으로 공격을 진행했습니다:
- 24,000개 이상의 허위 계정 생성
- 클로드와 1,600만 건 이상의 대화 생성
- 대화 데이터를 활용해 자사 모델 훈련 및 성능 향상
모델 증류의 위험성
앤스로픽은 합법적인 증류와 불법적인 증류를 구분합니다. AI 기업들이 고객용 소형·저비용 모델을 만드는 데 증류를 사용하는 것은 정당한 행위입니다. 그러나 해외 기업들이 미국 모델을 불법으로 증류할 경우, 안전 장치를 제거하고 추출된 역량을 자국의 군사·정보·감시 시스템에 활용할 수 있다는 것이 문제입니다.
업계 공동 대응 촉구
앤스로픽은 이러한 공격이 점점 더 치밀하고 정교해지고 있다고 경고하며, 이를 해결하기 위해서는 업계, 정책 입안자, AI 커뮤니티 전반의 신속하고 조율된 대응이 필요하다고 강조했습니다.
자세한 내용은 앤스로픽의 공식 발표문 Detecting and Preventing Distillation Attacks에서 확인할 수 있습니다.
Related Articles
앤스로픽이 중국 AI 기업 딥시크, 문샷 AI, 미니맥스가 2만 4천 개의 허위 계정으로 클로드와 1,600만 건 이상의 대화를 생성해 모델 역량을 추출했다고 폭로했습니다. 가짜 계정 수 및 교환 횟수 모두 전례 없는 규모입니다.
앤스로픽이 중국 AI 기업 딥시크, 문샷 AI, 미니맥스가 2만 4천 개의 허위 계정으로 클로드와 1,600만 건 이상의 대화를 생성해 모델 역량을 추출했다고 폭로했습니다. 가짜 계정 수 및 교환 횟수 모두 전례 없는 규모입니다.
Anthropic은 2026년 3월 6일 Claude Opus 4.6이 Firefox 취약점 CVE-2026-2796에 대한 테스트용 익스플로잇을 작성한 과정을 공개했다. 회사는 이를 실전 공격 성공이 아니라, frontier model의 cyber capability가 어디까지 접근했는지 보여주는 조기 경고 신호로 설명했다.
Comments (0)
No comments yet. Be the first to comment!