Mythos級セキュリティ解析は frontier model 専用か、Reddit が掘り下げた検証

Original: Local (small) LLMs found the same vulnerabilities as Mythos View original →

Read in other languages: 한국어English
AI Apr 10, 2026 By Insights AI (Reddit) 1 min read Source

何が起きたのか

r/LocalLLaMA で 587 upvotes と 120 comments を集めた投稿は、AISLE の AI Cybersecurity After Mythos: The Jagged Frontier を広く共有した。記事の主張は明確だ。Anthropic が Mythos と Project Glasswing の発表で強調した脆弱性解析の一部は、もっと小さくて安い model、あるいは open-weights model でもかなり再現できるという。そこから AISLE は、AI cybersecurity の moat は frontier model 単体よりも、system と scaffold、そしてそこに埋め込まれた security expertise にあるのではないかと論じている。

記事が示す evidence は具体的だ。AISLE は、関連 function を切り出した状態では FreeBSD NFS の代表的 bug を 8/8 の model が見つけたと報告する。さらに OpenBSD SACK bug のような難しいケースでも、より小さな model が核心部分の reasoning をかなり回収したとしている。加えて OWASP の false-positive 判別では、いくつかの小型 model が高価な frontier model を上回ったとされ、これが capability frontier は滑らかではなく "jagged" だという結論につながっている。

なぜ Reddit が食いついたのか

Reddit の重要な反応は実験の否定ではなく、前提条件への突っ込みだった。最も共感を集めたコメントの一つは「本当に難しいのは、その vulnerable code を見つけることだ」というものだ。ここが解釈の分岐点である。isolated な function を与えられて reasoning するのと、大きな repository を探索して attack surface を見つけ、正しい code path を絞り、exploitability を検証して patch や exploit chain に落とし込むのは別の仕事だ。さらに別の上位コメントでは、比較対象に使った model 世代の選び方が偏っているのではないかという批判もあった。

それでも thread が重要なのは、議論の軸を「どの lab の model が一番賢いか」からずらしたことだ。security work は modular であり、broad scanning、vulnerability detection、false-positive triage、patch generation、exploit construction は同じようには scaling しない。もし pipeline の一部で小型 model がすでに十分なら、競争力は orchestration、cost structure、tooling、evaluation design に移っていく。

Insights 読者にとっての要点もそこにある。この thread は frontier model が不要だと証明したわけではないし、小型 model が end-to-end autonomous security system を置き換えられるとも示していない。ただし Mythos の launch narrative よりも、AI security product の economics と architecture が開かれている可能性を示している。原文: r/LocalLLaMA, AISLE blog

Share: Long

Related Articles

AI Hacker News 2d ago 1 min read

Hacker Newsで浮上した Anthropic の Project Glasswing は、Claude Mythos 2 Preview を軸に major vendor と open-source defender を束ねる defensive security initiative だ。Anthropic は最大 100M ドルの usage credits と 4M ドルの直接寄付を投じ、critical software の防御を前倒しで進めるとしている。

AI Reddit 6d ago 1 min read

`r/LocalLLaMA` で話題になった Netflix の `VOID` は、video object removal だけでなく、その object が scene に生んだ physical interaction まで消すことを目指す model だ。公開された model card と repo には weights、code、notebook、training detail が含まれ、再現可能性の高さが評価された。

AI sources.x 18h ago 1 min read

Anthropic は X で Project Glasswing を紹介し、2026年4月7日の公式ページで critical software security initiative の全体像を公開した。Claude Mythos Preview を守る側へ先に渡し、重要な software infrastructure の防御を前倒しするという設計がポイントだ。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.