AI Hacker News 5h ago 1 min read $1,500のLLMハッキング実験、性能表よりguardrailとharnessの差が前面に HNの関心はsolve rateだけでなく、拒否ポリシー、tool loop、アカウント権限が結果をどう変えたかに向かった。 #llm-security#pentesting#firebase 1