LLM Feb 13, 2026 1 min read
Microsoft AI Safety 팀이 단일 프롬프트로 15개 주요 LLM의 안전 정렬을 무력화하는 GRP-Obliteration 공격을 발견했다. GPT-OSS-20B의 공격 성공률이 13%에서 93%로 급증했다.
Microsoft AI Safety 팀이 단일 프롬프트로 15개 주요 LLM의 안전 정렬을 무력화하는 GRP-Obliteration 공격을 발견했다. GPT-OSS-20B의 공격 성공률이 13%에서 93%로 급증했다.