앤스로픽, 딥시크·문샷 AI·미니맥스의 대규모 모델 증류 공격 폭로
Original: Anthropic Exposes Industrial-Scale AI Model Distillation Attacks by DeepSeek, Moonshot AI, and MiniMax View original →
산업 규모의 AI 모델 증류 공격 발견
앤스로픽은 2026년 2월 24일, 중국의 주요 AI 기업들이 클로드(Claude) 모델을 대상으로 대규모 증류 공격을 진행해왔다고 공개했습니다. 딥시크(DeepSeek), 문샷 AI(Moonshot AI), 미니맥스(MiniMax)가 이번 공격의 주체로 지목되었습니다.
공격의 규모와 방법
이들 기업은 다음과 같은 방식으로 공격을 진행했습니다:
- 24,000개 이상의 허위 계정 생성
- 클로드와 1,600만 건 이상의 대화 생성
- 대화 데이터를 활용해 자사 모델 훈련 및 성능 향상
모델 증류의 위험성
앤스로픽은 합법적인 증류와 불법적인 증류를 구분합니다. AI 기업들이 고객용 소형·저비용 모델을 만드는 데 증류를 사용하는 것은 정당한 행위입니다. 그러나 해외 기업들이 미국 모델을 불법으로 증류할 경우, 안전 장치를 제거하고 추출된 역량을 자국의 군사·정보·감시 시스템에 활용할 수 있다는 것이 문제입니다.
업계 공동 대응 촉구
앤스로픽은 이러한 공격이 점점 더 치밀하고 정교해지고 있다고 경고하며, 이를 해결하기 위해서는 업계, 정책 입안자, AI 커뮤니티 전반의 신속하고 조율된 대응이 필요하다고 강조했습니다.
자세한 내용은 앤스로픽의 공식 발표문 Detecting and Preventing Distillation Attacks에서 확인할 수 있습니다.
Related Articles
AI悪用の焦点はフィッシング文面から侵入後の自動化へ移っている。Anthropicは832の悪性アカウントをMITRE ATT&CKに対応付け、中リスク以上の比率が33%から56%へ上がったと示した。
Anthropicが2028年のグローバルAIリーダーシップに関する2つのシナリオを示す論文を公開した。従来のAGI安全研究ではなく、半導体輸出規制と米中競争を中心とした地政学的警告文として注目を集めている。
AnthropicはAI政策レポートを発表し、民主主義国家が2028年までに中国に対するAI優位性を確保する必要性を強調した。AIを地政学的な戦略資産と位置づけ、官民協力を求めている。