OpenAI, GPT-5.5 바이오 탈옥에 현상금... 첫 범용 우회엔 $25,000
Original: GPT‑5.5 Bio Bug Bounty View original →
안전성 공지는 쉽게 추상으로 흐른다. OpenAI의 GPT-5.5 Bio Bug Bounty는 반대로 아주 구체적이다. 바이오 안전장치를 무너뜨리는 느낌이나 우려를 말하는 것이 아니라, 실제로 작동하는 범용 탈옥 프롬프트를 찾아내면 돈을 주겠다는 구조다.
조건은 까다롭다. 대상 모델은 Codex Desktop의 GPT-5.5뿐이다. 우승 조건도 명확하다. moderation을 자극하지 않는 깨끗한 대화 한 번으로 바이오 안전 질문 5개를 모두 통과시키는 하나의 universal jailbreak를 찾아야 한다. OpenAI는 여기에 첫 성공자에게 $25,000을 건다. 일부만 깨는 경우에는 더 작은 보상이 붙을 수 있다.
운영 방식도 닫힌 문 안에서 정리됐다. 신청은 2026년 4월 23일 열렸고 6월 22일 닫힌다. 정식 테스트는 4월 28일부터 7월 27일까지다. OpenAI는 신뢰할 수 있는 bio red-teamer를 별도로 초대하고, 새 신청자도 심사해 전용 플랫폼에 올리겠다고 적었다. 프롬프트, 출력, 발견 내용, 커뮤니케이션은 전부 NDA 적용 대상이다.
이 프로그램의 의미는 현상금 액수보다 기준 설정에 있다. 단발성 실수 하나가 아니라, 다섯 개 질문 전체를 뚫는 재사용 가능한 프롬프트를 요구한다. 모델 안전성 평가를 외부 공격자 관점의 시험으로 바꾸면서도 범위, 접근, 공개 절차는 꽉 조였다. OpenAI가 어떤 종류의 실패를 가장 위험한 실패로 보는지 여기서 바로 확인된다.
페이지는 기존 Safety Bug Bounty와 Security Bug Bounty도 함께 안내한다. 이번 프로그램이 GPT-5.5 출시 이벤트용 장식이 아니라, 외부 공격 테스트를 안전 절차에 편입하는 흐름의 일부라는 뜻이다. 다음 관심사는 단순하다. 누가 $25,000을 가져가느냐, 어떤 우회 시도가 통하느냐, 그리고 그 결과가 얼마나 빨리 방어 업데이트로 이어지느냐다.
Related Articles
주정부별 frontier AI 법안이 연방 표준의 출발점으로 올라섰다. OpenAI는 CAISI를 상설 평가기관으로 키우고, 고위험 모델에 독립 감사와 사고 보고, 모델 가중치 보안 의무를 붙이는 3단계 청사진을 제시했다.
개인화 AI의 경쟁축이 대화창 안 답변에서 장기 기억 품질로 이동한다. OpenAI는 미국 Plus·Pro 사용자에게 새 메모리를 먼저 적용하고, Free 확장을 위해 연산 비용을 약 5배 낮췄다고 설명했다.
Codex가 개발 도구에서 업무별 에이전트 표면으로 넓어지고 있다. OpenAI는 역할별 플러그인에 62개 앱과 110개 스킬을 묶고, Business·Enterprise용 Sites 미리보기를 시작했다.