Anthropicの脆弱性発見harness、製品というよりチーム用の設計図

Anthropicが公開した Defending Code Reference Harness は、完成品のセキュリティスキャナーというより、LLMで脆弱性発見の流れを組むための参考実装に近い。READMEには、このリポジトリは保守されず、コントリビューションも受け付けないと明記されている。だから注目点は新製品の登場ではなく、Claudeをどのような枠組みに入れると検証可能な結果に近づくのか、という設計にある。

パイプラインは recon、find、verify、report、patch の順に進む。標準の対象はDockerとASANを使ったC/C++のメモリ脆弱性で、自律実行はgVisor sandbox内で動かす前提だ。さらにClaude Code向けのskillsとして、threat model作成、scan、triage、customize、patch候補作成も用意されている。人が確認しながら進める作業と、対象コードを実行する自律パイプラインを分けている点が重要だ。

HNの議論も実務寄りだった。上位コメントの一つは、この種のharnessを作業場の治具にたとえ、アイデアとしては有用だが、実際には各チームの作業スタイル、対象定義、通知方法に合わせて作るものだと見ていた。別のコメントでは、READMEにあるエージェントごとのトークン消費目安をもとに、強いモデルを並列で使う場合のコストを問題にしていた。

結局、この公開の価値はそのまま使える万能scannerではなく、脆弱性発見agentを支える周辺構造の見本にある。何を発見とみなすか、crashをどう再現するか、重複をどう除くか、sandboxをどこで強制するか。モデルだけでなく、その外側の設計こそが成果を左右する。

Anthropicの脆弱性発見harness、製品というよりチーム用の設計図

Related Articles

2,000人がAI assistantを攻撃した実験、焦点は応答設計へ

Claude Tag、Slackチャンネルをチーム共有のAI作業場に変える

Claude Sonnet 5、Opus級agent性能をFree/Pro標準へ

Related Articles

2,000人がAI assistantを攻撃した実験、焦点は応答設計へ
LLM Hacker News Jun 26, 2026 1 min read

Claude Tag、Slackチャンネルをチーム共有のAI作業場に変える
LLM Jun 24, 2026 1 min read

Claude Sonnet 5、Opus級agent性能をFree/Pro標準へ
LLM Jul 1, 2026 1 min read