LLM Feb 13, 2026 1 min read
Microsoft AI Safetyチームが単一プロンプトで15の主要LLMの安全性アライメントを無力化するGRP-Obliteration攻撃を発見。GPT-OSS-20Bの攻撃成功率が13%から93%に急増した。
Microsoft AI Safetyチームが単一プロンプトで15の主要LLMの安全性アライメントを無力化するGRP-Obliteration攻撃を発見。GPT-OSS-20Bの攻撃成功率が13%から93%に急増した。