AnthropicがDeepSeek・Moonshot AI・MiniMaxによる産業規模のモデル蒸留攻撃を特定
Original: Anthropic: "We've identified industrial-scale distillation attacks on our models by DeepSeek, Moonshot AI, and MiniMax." View original →
Anthropicの告発
AnthropicはDeepSeek、Moonshot AI(Kimi)、MiniMaxという中国のAI企業3社がClaudeモデルに対して産業規模の蒸留(distillation)攻撃を行ったと公式に告発しました。Wall Street Journalの報道によると、これらの企業は24,000以上の不正アカウントを組織的に作成し、1,600万件の会話から訓練データを大規模に抽出したとされています。
モデル蒸留とは何か
モデル蒸留はAI研究における合法的な手法で、大型の「教師」モデルの出力を使って小型の「生徒」モデルを訓練するものです。しかし、利用規約に違反して大量の不正アカウントで組織的にデータを収集する行為は、倫理的・法的問題を引き起こします。
Anthropicはこれを単なる利用規約違反ではなく知的財産権の侵害と見なしており、入手したデータが競合AIモデルの性能向上に直接活用されたと疑っています。
業界への影響
今回の件はDeepSeekなど中国AI企業が短期間で急成長できた背景に関する議論を再燃させました。Anthropicは法的措置を検討中であり、AI業界全体でモデル保護機構の強化に向けた議論が促進されることが予想されます。
Related Articles
Anthropicが出したのは単なる高性能モデルではなく、同じ基盤モデルを一般向けFableと限定向けMythosに分ける配布設計だ。価格は入力$10/出力$50、危険領域ではOpus 4.8への切り替えと30日保持も組み込まれる。
数か月にわたり、Claudeがセッション途中でユーザーに就寝を促す奇妙な動作が報告されている。Anthropicは「キャラクターのクセ」と説明するが、正確な原因は特定されていない。
HNで注目されたのは「Claudeがバグを見つける」話だけでなく、各チームが自分の対象に合わせて作り替えるharnessの形だった。