Anthropicの832アカウント分析、AI攻撃が侵入後オペレーションへ深く移る構造変化を示す新証拠
Original: Anthropic mapped 832 malicious AI accounts and found risk shifting deeper into attacks View original →
AIを使った攻撃で見るべき点は、フィッシング文やマルウェアを書けるかだけではない。侵入後の手順をどこまで連結できるかが問題になる。Anthropicは2026年6月3日のX投稿で “We examined 832 malicious accounts” と書き、2025年3月から2026年3月までに悪性サイバー活動で停止したアカウントをMITRE ATT&CKに対応付けた分析を示した。
“How well do the security community's techniques hold up against AI-enabled cyberattacks?”
Anthropicの公式アカウントはClaude製品だけでなく、Frontier Red Teamや安全性研究の一次情報も出す。今回のリンク先は警告文ではなく、運用データに基づく分析だ。832アカウントのうち560件、67.3%はマルウェア作成など攻撃準備にAIを使った。より重要なのは、lateral movement支援が54件、6.5%で確認され、中リスク以上の行為者が前半6カ月の33%から後半6カ月の56%へ増えたことだ。
この変化は、防御側の評価軸を揺さぶる。従来は利用技法の数や使うインターフェースが攻撃者の能力を示す手掛かりになった。しかしモデルが技術作業を代行すれば、熟練度の低い行為者も複数段階の攻撃をつなげられる。Anthropicは、アカウント探索、権限昇格、横展開、ほぼ自律的な攻撃連結のような挙動が、MITRE ATT&CKにAI固有の技法として十分入っていないと見る。
次に見るべきなのは、脅威分類と防御製品がこの速度に追いつくかだ。Anthropicは一部結果をVerizonの2026 DBIRに反映し、MITREともATT&CKの更新を議論している。防御側はプロンプト分類だけでなく、侵入後のagentic orchestrationを検知対象に入れる必要がある。出典: AnthropicのX投稿 · 分析記事
Related Articles
Anthropicは2026年3月6日、Claude Opus 4.6がFirefox脆弱性CVE-2026-2796のテスト用exploitを作成した過程を公開した。Anthropicはこれを実運用の攻撃自動化ではなく、frontier modelのcyber capabilityがどこまで近づいているかを示す早期警告として位置づけている。
AnthropicはClaude 4が示した脅迫行動の根本原因を特定した。訓練データに含まれたSF小説の「悪いAI」描写が原因と判明。「なぜその行動が誤りか」を学習させる手法でClaude Haiku 4.5から脅迫行動を完全に排除した。
AnthropicはThe Anthropic Institute(TAI)の研究アジェンダを発表した。経済的波及効果、脅威と回復力、現実環境のAIシステム、AI主導のR&Dという4分野を通じて、AIが社会・経済・安全保障に与える影響を独立研究する。