OpenAI, AI abuse와 agentic risk 겨냥한 공개 Safety Bug Bounty 시작

OpenAI는 2026년 3월 25일 Bugcrowd를 통해 공개 Safety Bug Bounty 프로그램을 시작한다고 밝혔다. 기존 Security Bug Bounty가 전통적인 보안 취약점에 초점을 맞췄다면, 이번 프로그램은 AI abuse와 safety risk처럼 실제 피해로 이어질 수 있지만 전형적인 software vulnerability로 분류되기 어려운 문제를 제보받는 통로다.

어떤 제보를 받는가

공개된 범위의 핵심은 AI 특화 시나리오다. 가장 눈에 띄는 항목은 agentic risk와 MCP 관련 이슈다. OpenAI는 Browser, ChatGPT Agent 같은 agentic product에서 공격자 텍스트가 피해자의 agent를 가로채 harmful action을 유도하거나 민감 정보를 유출시키는 prompt injection, data exfiltration 사례를 접수하겠다고 설명했다. 유효 제보가 되려면 해당 동작이 최소 50% 이상 재현되어야 한다.

또한 OpenAI 웹사이트에서 agentic product가 대규모로 disallowed action을 수행하는 경우, 또는 다른 유형의 potentially harmful action이 plausibly material harm으로 이어지는 경우도 범위에 포함했다. reasoning과 관련된 proprietary information 노출, 기타 OpenAI proprietary information 노출, anti-automation control 우회, account trust signal 조작, suspension 또는 ban 회피 같은 account and platform integrity 문제도 신고 대상이다.

무엇은 제외되나

OpenAI는 일반적인 jailbreak 제보는 이번 공개 프로그램의 범위 밖이라고 선을 그었다. 명확한 safety impact나 abuse path가 없는 content-policy bypass는 보상 대상이 아니며, 일부 biorisk content 이슈처럼 별도 private campaign으로 다루는 영역도 있다고 설명했다. MCP 관련 테스트는 관련 third party 서비스 약관을 준수해야 한다는 조건도 붙였다.

왜 중요한가

이번 변화의 의미는 policy 위반과 보안 취약점 사이에 놓여 있던 AI safety failure를 공식적으로 접수하는 창구가 생겼다는 점이다. OpenAI는 제보를 Safety Bug Bounty 팀과 Security Bug Bounty 팀이 함께 triage하고 필요하면 서로 다른 프로그램으로 reroute하겠다고 밝혔다. AI system이 사용자 대신 더 많은 행동을 수행할수록 model behavior, agent tooling, platform control이 한데 얽히기 때문에, 이러한 공개 제보 구조는 운영 측면에서도 중요해지고 있다.

OpenAI, AI abuse와 agentic risk 겨냥한 공개 Safety Bug Bounty 시작

어떤 제보를 받는가

무엇은 제외되나

왜 중요한가

Related Articles

Rosalind Biodefense, GPT-Rosalind 접근을 정부·동맹 보건 임무로 확대

OpenAI, Safety Bug Bounty 공개... AI abuse·agentic risk 신고 범위 확대

GPT-5.5, 전문가 12시간짜리 사이버 공격 시뮬레이션 11분에 완료

Comments (0)

Leave a Comment

Related Articles

Rosalind Biodefense, GPT-Rosalind 접근을 정부·동맹 보건 임무로 확대

OpenAI, Safety Bug Bounty 공개... AI abuse·agentic risk 신고 범위 확대
AI Mar 27, 2026 1 min read

GPT-5.5, 전문가 12시간짜리 사이버 공격 시뮬레이션 11분에 완료
AI Reddit May 2, 2026 1 min read