Hacker Newsで続いたMythos後の論争: 小さなopen-weight modelでもAI security分析の一部を再現できるのか
Original: Small models also found the vulnerabilities that Mythos found View original →
Hacker Newsのスレッドは、AISLEのpost-Mythos分析をめぐって、現在のAI security作業に frontier model がどこまで必須なのかという論点に集中した。AISLEはAnthropicのMythosを否定していない。むしろ、脆弱なコードをすでに絞り込み、taskを強く framing すれば、より小さく安価なopen-weight modelでも見出し級のsecurity reasoningのかなりの部分を再現できると主張している。
記事の根拠はかなり具体的だ。AISLEによれば、scoped reviewで試した8つのmodelはすべてMythosの代表的なFreeBSD exploitを検出し、その中にはoverflowをcriticalと判断した3.6B-active modelも含まれる。さらに5.1B-activeのopen modelは、古いOpenBSD bugの中心的な reasoning を回収したという。そこからAISLEは、cyber capabilityは一直線のfrontierではなく jagged だという広い主張へ進む。
- AISLEは、8つのtested modelすべてがscoped FreeBSD exploitを見つけたと述べた。
- 小さなopen modelでもtargeted security reasoningには十分使える可能性があるという主張だ。
- HNの争点は、scoped contextをfull codebase discoveryと同列に扱えるかどうかだった。
ただしHNの上位コメントは、この一般化にかなり慎重だった。複数のコメントは、vulnerable functionを先に渡した時点で、現実の脆弱性研究で最も難しい段階である relevant path の発見と、実用的な exploitability の立証が抜け落ちると指摘した。一方で、現代のagent scaffoldは実際にもfile単位でcontextを狭めるため、scoped contextは完全に人工的な条件ではないという反論もあった。
実務的な読み方は中間にある。小さなmodelでも targeted triage、exploit review、second-pass analysis には十分強いかもしれず、それはコストに敏感なsecurity pipelineでは重要だ。ただ、HNスレッドはそれだけで small open model が frontier system を fully autonomous discovery loop で置き換えられるとは見なしていない。ここでの結論も、model size以上にmethodologyを見るべきだという点に集約される。
Related Articles
LocalLLaMA で強く共有された記事は、Anthropic Mythos が例示した脆弱性解析の一部を、より小さく安い open または low-cost model でもかなり再現できると主張した。ただし Reddit の中心的な反応は、isolated な vulnerable function を読むことと、大規模 codebase からその bug を見つけることは別問題だというものだった。
Hacker Newsで大きく読まれたAISLEの投稿は、Anthropic Mythosの発表がAI securityという領域の現実性を示した一方で、優位性が特定のmodelだけに閉じているとは言えないと論じる。適切なcode pathを切り出せば、小型のopen modelでも重要な分析をかなり再現できたという主張だ。
Anthropicは2026年4月7日のXで、AWS、Apple、Google、Microsoft、NVIDIAなどとProject Glasswingを立ち上げると発表した。Anthropicによると、この取り組みではClaude Mythos Previewを防御的cybersecurity workflowに投入し、最大1億ドルのusage creditsと400万ドルの寄付を組み合わせてcritical softwareの保護を進める。
Comments (0)
No comments yet. Be the first to comment!