Anthropic, 중국 AI 기업들이 Claude에서 1,600만 건 데이터 탈취했다고 고발
Original: Anthropic is accusing DeepSeek, Moonshot AI (Kimi) and MiniMax of setting up more than 24,000 fraudulent Claude accounts, and distilling training information from 16 million exchanges. View original →
역대급 AI 데이터 탈취 의혹
Anthropic이 중국 AI 기업 DeepSeek, Moonshot AI(Kimi), MiniMax를 상대로 충격적인 고발을 제기했습니다. Wall Street Journal의 보도에 따르면, 이 세 기업이 24,000개 이상의 허위 Claude 계정을 조직적으로 설정하고 총 1,600만 건의 대화 교환에서 훈련 데이터를 무단으로 추출했다는 것입니다.
Distillation의 문제점
Distillation(지식 증류)은 대규모 언어 모델(LLM)의 출력을 활용해 소규모 또는 경쟁 모델을 훈련시키는 기법입니다. Anthropic의 서비스 약관은 Claude의 출력을 경쟁 AI 모델 훈련에 사용하는 것을 명시적으로 금지하고 있습니다. 무단으로 이런 대규모 작업을 수행하는 것은 약관 위반이자 지식재산권 침해에 해당합니다.
산업적 규모의 위반
이번 사건의 핵심은 규모입니다. 24,000개 이상의 허위 계정을 체계적으로 운영하며 1,600만 건에 달하는 대화를 수집했다는 점에서 조직적이고 의도적인 데이터 탈취 작전으로 보입니다. Anthropic은 자사 블로그에서 이를 '산업 규모의 distillation 공격'이라고 표현했습니다.
중국 AI 부상과 지식재산권 갈등
DeepSeek은 2024년 말부터 2025년 초까지 GPT-4급 성능을 저비용으로 구현했다는 주장으로 글로벌 AI 업계를 뒤흔든 바 있습니다. 이번 고발은 해당 성과의 일부가 불법적인 데이터 획득에 기반했을 가능성을 제기합니다. Moonshot AI(Kimi)와 MiniMax 역시 급성장하는 중국 AI 스타트업으로, 이번 사건은 미중 AI 경쟁의 새로운 전선이 될 전망입니다.
업계의 파장
이번 고발은 AI 업계 전반에 중요한 선례를 남길 수 있습니다. 오픈소스와 상업적 AI 서비스의 경계, 모델 출력의 저작권 보호 범위, 그리고 경쟁 기업 간 데이터 사용의 윤리적 기준에 대한 논쟁이 본격화될 것으로 보입니다. Anthropic은 이미 자사 블로그를 통해 이러한 distillation 공격의 증거를 공개하며 업계의 경각심을 높이고 있습니다.
Related Articles
Anthropic이 Claude의 내부 활성화값을 인간이 읽을 수 있는 텍스트로 변환하는 자연어 오토인코더(NLA) 기술을 공개했다. 모델 내부 상태를 직접 해석해 AI 감사와 정렬 연구에 활용할 수 있다는 점에서 해석 가능성 연구의 새 이정표다.
Cloudflare가 Anthropic의 보안 특화 모델 Mythos Preview를 자사 인프라에 실전 테스트한 결과를 공개했다. Mythos는 개별 저위험 버그들을 연결해 실제로 동작하는 익스플로잇을 생성할 수 있으며, 이는 시니어 보안 연구자 수준의 추론 능력을 보여준다.
AI 보안의 쟁점이 피싱 작성에서 침투 이후 자동화로 이동하고 있다. Anthropic은 832개 악성 계정을 MITRE ATT&CK에 매핑했고, 중위험 이상 행위자 비율이 33%에서 56%로 뛰었다고 밝혔다.