Anthropic、Mozillaとの協力でClaude Opus 4.6がFirefox脆弱性22件を発見したと報告
Original: We partnered with Mozilla to test Claude's ability to find security vulnerabilities in Firefox. Opus 4.6 found 22 vulnerabilities in just two weeks. Of these, 14 were high-severity, representing a fifth of all high-severity bugs Mozilla remediated in 2025. View original →
X投稿で示された内容
Anthropicは2026年3月6日のX投稿で、Mozillaと連携してClaudeのFirefox脆弱性探索能力を検証したと発表した。公表された数字は大きい。Claude Opus 4.6は2週間で22件の脆弱性を発見し、そのうち 14件が高深刻度 とされた。Anthropicは、この14件がMozillaが2025年に修正した高深刻度Firefox脆弱性全体の約5分の1に相当すると説明している。
同時公開の公式記事では、より実務的な情報も示された。Anthropicによれば、研究チームは約 6,000のC++ファイル を調査し、112件のユニークリポート を提出した。関連する修正の大半はすでに Firefox 148 に反映され、残りも今後のリリースで対応される予定だという。
なぜ重要なシグナルなのか
この話が大きいのは、単なる評価用ベンチマークではなく、数億人規模で使われる実ソフトウェアの脆弱性発見につながっている点だ。ブラウザは日常的に信頼できないコードやコンテンツを処理するため、脆弱性の危険度が高い。そこで発見速度が上がることは、防御側にも製品ベンダーにも直接的な意味を持つ。
さらに、Anthropicの記事はプロセス面の変化も示している。Mozillaは初期の検証後、すべてを手作業で確証してからではなく、発見結果をまとめて提出するよう勧めたという。これは、モデルが生み出す候補の量がすでに既存の審査フローを変え始めていることを示す。
今後の実務への含意
次の焦点はトリアージ体制だ。フロンティアモデルがこの規模で有効な候補を出せるなら、セキュリティチームは再現、優先順位付け、修正、公開までの工程をより強く自動化・標準化する必要がある。発見だけでなく、修復の全工程が新しいボトルネックになる。
もう一つの論点は攻撃側への波及だ。Anthropicは現時点で、モデルは脆弱性発見のほうが悪用より得意だと述べているが、同じ記事で悪用能力の評価も進めている。防御側としては、AI支援の脆弱性探索を一時的な話題ではなく、恒常的なセキュリティ環境の変化として扱う必要がある。
Related Articles
HNで注目されたのは「Claudeがバグを見つける」話だけでなく、各チームが自分の対象に合わせて作り替えるharnessの形だった。
Anthropicが出したのは単なる高性能モデルではなく、同じ基盤モデルを一般向けFableと限定向けMythosに分ける配布設計だ。価格は入力$10/出力$50、危険領域ではOpus 4.8への切り替えと30日保持も組み込まれる。
Claude Fable 5がGDPval-AAで1932点を記録し、エージェント型の実業務ベンチマークで首位に立った。Anthropic系モデルが上位4枠のうち3枠を占め、長時間タスクの評価軸がさらに重要になっている。