#pentesting - Insights

AI Hacker News Jun 4, 2026 1 min read

$1,500のLLMハッキング実験、性能表よりguardrailとharnessの差が前面に

HNの関心はsolve rateだけでなく、拒否ポリシー、tool loop、アカウント権限が結果をどう変えたかに向かった。