Anthropic、AI支援の脆弱性検出向けにClaude Code Securityをプレビュー公開
Original: Making frontier cybersecurity capabilities available to defenders View original →
Anthropicがcyberdefense研究を製品化し始めた
Anthropicは2026年2月20日、Claude Code SecurityをClaude Codeのweb版でlimited research previewとして提供開始した。会社説明によれば、この機能はコードベースを走査してsecurity vulnerabilityを見つけ、人間がレビューできるtargeted software patchを提案する。提供対象はまずEnterpriseとTeamの顧客で、open-source repositoryのmaintainerには優先的なアクセスも用意される。
問題設定は明快だ。security teamは増え続けるコードと脆弱性に向き合っている一方、微妙で文脈依存の問題を深く調べられる専門家は不足している。Anthropicは、既存のstatic analysisが既知パターンには有効でも、broken access controlやbusiness-logic flawのような複雑な問題は見逃しやすいと説明する。
static analysisと何が違うのか
Anthropicによると、Claude Code Securityは単なるsignature matchingではない。人間のsecurity researcherのようにコードを読み、コンポーネント同士の相互作用や、アプリケーション内でのデータの流れを追跡する。こうした広い文脈理解によって、孤立したファイルやルールベース検査だけでは見つけにくい脆弱性を発見しやすくするという。
さらに同社は、すべての検出結果がanalystに届く前にmulti-stage verificationを通るとしている。Claudeは自ら結果を反証または裏付けようとし、severityとconfidenceを付与し、検証済みのfindingだけをdashboardに表示する。そこでは提案されたfixも確認できる。ただしAnthropicは、何も自動適用されず、最終判断は常に開発者が行うと明言している。
発表を支える内部研究の主張
このpreviewは、1年以上にわたる社内cybersecurity研究の上に構築されたという。Anthropicは、Frontier Red TeamがClaudeをcompetitive Capture-the-Flagに投入し、Pacific Northwest National Laboratoryとcritical infrastructure防御の実験を行い、脆弱性の発見と修正の流れを継続的に改善してきたと説明した。特にClaude Opus 4.6を使って、production open-source codebasesから500件超のvulnerabilitiesを見つけたと主張している。
この数字はかなり強い主張であり、Anthropic自身もtriageとresponsible disclosureが進行中だと述べている。それでもこの発表が重要なのは、AI security研究がデモから一歩進み、既存の開発工程の中で試せる具体的なdefender workflowへ移行していることを示しているからだ。
なぜ今重要なのか
Anthropicの立場は、AIは攻撃側にも防御側にも使われるというものだ。もしモデルがexploitable weaknessをより速く見つけられるようになるなら、defender側も検証、ガバナンス、人間承認を伴った同等の能力を持つ必要がある。Claude Code Securityは、その考えをred-team実験ではなく製品の形で実装しようとする試みだといえる。
出典: Anthropic公式発表。
Related Articles
Hacker Newsで広がったAnthropicとMozillaの協業事例は、Claude Opus 4.6がFirefoxで22件の脆弱性を発見し、そのうち14件がhigh-severityと分類されたことを示した。要点は自律的な魔法ではなく、verifierとtriageを備えたdefender workflowが速くなることにある。
Anthropicは2026年3月6日、Claude Opus 4.6がFirefox脆弱性CVE-2026-2796のテスト用exploitを作成した過程を公開した。Anthropicはこれを実運用の攻撃自動化ではなく、frontier modelのcyber capabilityがどこまで近づいているかを示す早期警告として位置づけている。
Microsoft Threat Intelligenceは2026年3月6日、攻撃者が調査、phishing、malware開発、侵害後分析までAIを活用していると報告した。AIはまだ大規模な完全自律侵入を実現していないが、攻撃の速度・規模・持続性をすでに押し上げているという整理だ。
Comments (0)
No comments yet. Be the first to comment!