Anthropic、Claude発見脆弱性向けdisclosure方針を公開
Original: Coordinated vulnerability disclosure for Claude-discovered vulnerabilities View original →
Anthropicが示した運用方針
Anthropicは2026年3月6日、Claudeを含む自社AI systemが見つけた脆弱性に対するcoordinated vulnerability disclosureの考え方を公開した。対象はopen-source projectと、検証が正式に認められたclosed-source softwareだ。
この文書が重要なのは、AI-assisted codingやanalysis systemが現実のsoftware flawを見つける能力を急速に高めているからだ。Anthropicはその能力がさらに広がる前に、先に運用ルールを置こうとしている。すべての報告は公開前にhuman reviewと確認を経ること、そして脆弱性発見やcandidate patchにAIが関与した場合は明確に表示することを打ち出した。
公開期限とescalation
Anthropicの標準disclosure期間は90 daysだ。maintainerが積極的に対応していて追加時間を求める場合は、14-day extensionを認める可能性がある。すでに悪用されているcritical vulnerabilityについては、7 daysでの公開を目標とし、fixが進んでいれば追加の7-day extensionもあり得るとしている。
maintainerが30 days以内に応答しない場合、Anthropicは外部coordinatorへescalationし、元の公開タイムラインを維持する方針だという。さらにpatchが用意された後も、downstream userが修正を展開する時間を確保するため、full technical detailsの公開を通常45 days待つとしている。
- Human review: すべての報告を提出前に検証する。
- Provenance labeling: AI発見の脆弱性か、AI生成のpatch提案かを表示する。
- Submission pacing: 合意なしに単一projectへ大量の報告を送らない。
より大きな意味は、frontier AI labの責任範囲が広がっていることにある。coding agentが大規模に脆弱性を見つけられるようになると、速度だけでなく、証拠、patch coordination、downstream risk管理まで必要になる。Anthropicは、modelを出すだけでecosystemへの影響をmaintainer任せにしないという規範を示した。
Related Articles
AnthropicのProject Glasswingは、Claude Mythos Previewでhighまたはcriticalの脆弱性を1万件超見つけた。焦点は発見能力から、検証・開示・修正を回す運用能力へ移っている。
AIによるAI開発は抽象論から実測指標へ移りつつある。AnthropicはMythos Previewが最適化課題で約52倍、研究判断テストで64%の優位を示したと説明した。
AI悪用の焦点はフィッシング文面から侵入後の自動化へ移っている。Anthropicは832の悪性アカウントをMITRE ATT&CKに対応付け、中リスク以上の比率が33%から56%へ上がったと示した。