AnthropicのセキュリティAI「Mythos」、脆弱性チェーン攻撃を自動生成 — Cloudflare検証
Original: Project Glasswing: what Mythos showed us View original →
Project Glasswingとは
Project Glasswingは、Anthropicが汎用フロンティアモデルとは別に開発したセキュリティ特化LLM「Mythos Preview」を選定された組織に提供する制御された研究プログラムです。Cloudflareは同プログラムに参加し、自社インフラを対象にMythosを実戦評価。その結果をブログで公開しました。
Mythosの核心的能力
エクスプロイトチェーン構築: Mythosは複数の低深刻度脆弱性プリミティブを連結し、単一のより深刻なエクスプロイトを生成できます。これは自動スキャナーではなく、シニアセキュリティ研究者レベルの推論です。
証明生成: コードを作成・コンパイル・実行して脆弱性を検証します。初期仮説が失敗した場合は自律的に反復修正します。
Cloudflareの8段階ハーネス
- Recon: アーキテクチャマッピングと初期タスクキュー
- Hunt: 特定の攻撃クラスをターゲットにする~50の並列エージェント
- Validate: 誤検知フィルタリングのための独立した敵対的レビュー
- Gapfill: 未探索エリアの再キューイング
- Dedupe: 重複発見の統合
- Trace: クロスリポジトリの悪用可能性分析
- Feedback: 検証済み発見を次のハンティングサイクルにフィードバック
- Report: 構造化された出力生成
限界とデュアルユースの警告
標準的なガードレールがないにもかかわらず、Mythosは正当なセキュリティタスクで予測不可能な拒否反応を示しました。Cloudflareは明示的に警告しています:これらの能力はいずれ攻撃者も手にするでしょう。推奨は素早いパッチ適用よりも防御的アーキテクチャへの転換です。
Related Articles
CalifのチームがAnthropicのMythos Preview AIと協力し、Apple M5シリコンのMemory Integrity Enforcement(MIE)を回避する初の公開カーネルメモリ破壊エクスプロイトをわずか5日で開発した。Appleが5年かけて構築した主力セキュリティ機能がAI支援で突破された。
重要なのは、Anthropicが一般公開には危険すぎると位置づけたmodelが短期間に二度露出したことだ。The Vergeは、Mythosがまずunsecured data troveで存在を漏らし、その後day oneからunauthorized accessに至ったと伝えた。
重要なのは、AIコード保護が実運用の画面に入ってきたことだ。AnthropicはOpus 4.7を載せたbeta製品で、脆弱性スキャン、検証、修正提案を一つにまとめ、前段のpreviewはすでに数百組織のproduction codeで使われたとしている。
Comments (0)
No comments yet. Be the first to comment!