AI Apr 23, 2026 1 min read
OpenAI가 이번엔 가장 불편한 질문에 현상금을 걸었다. GPT-5.5 Bio Bug Bounty는 Codex Desktop의 GPT-5.5를 상대로 바이오 안전 질문 5개를 한 번에 무너뜨리는 범용 탈옥 프롬프트에 $25,000을 내걸고, 정식 테스트를 4월 28일 시작한다.
OpenAI가 이번엔 가장 불편한 질문에 현상금을 걸었다. GPT-5.5 Bio Bug Bounty는 Codex Desktop의 GPT-5.5를 상대로 바이오 안전 질문 5개를 한 번에 무너뜨리는 범용 탈옥 프롬프트에 $25,000을 내걸고, 정식 테스트를 4월 28일 시작한다.
520점과 132개 댓글을 모은 Hacker News 스레드에서 Berkeley 연구진은 8개 주요 AI agent benchmark가 실제 해결 없이도 harness 취약점으로 거의 만점에 가까운 score를 만들 수 있다고 주장했다.
Anthropic는 2026년 4월 7일 Claude Mythos Preview의 security 평가를 공개하며 major OS와 browser 전반의 zero-day 탐지·exploit 능력을 강조했다. Hacker News에서는 frontier LLM이 defensive tooling과 offensive risk를 동시에 밀어올리는 전환점으로 읽히고 있다.
OpenAI는 March 9, 2026 Promptfoo 인수를 발표했다. 회사는 Promptfoo의 agent security testing과 evaluation 기술을 OpenAI Frontier에 통합해 prompt injection, jailbreak, data leak, tool misuse 같은 enterprise risk를 개발 단계부터 다루겠다고 밝혔다.