AI Feb 16, 2026 1 min read
OpenAI는 모델이 충돌하는 지시를 해석할 때 system→developer→user 순서의 instruction hierarchy를 따르도록 하는 안전 정렬 프레임을 설명했다. 회사 공개 평가에서 불확실한 요청에 대한 거절 비중이 약 59%에서 약 97%로 개선됐다고 밝혔다.
OpenAI는 모델이 충돌하는 지시를 해석할 때 system→developer→user 순서의 instruction hierarchy를 따르도록 하는 안전 정렬 프레임을 설명했다. 회사 공개 평가에서 불확실한 요청에 대한 거절 비중이 약 59%에서 약 97%로 개선됐다고 밝혔다.