Anthropic, Claude가 찾은 취약점 공개 원칙 수립

Anthropic는 2026년 3월 6일 Claude가 발견한 취약점에 대해 어떤 방식으로 공개와 조율을 진행할지 설명하는 coordinated vulnerability disclosure 원칙을 발표했다. Anthropic는 AI 도구가 software vulnerability를 더 빠르고 더 저렴하게 찾아낼 수 있는 만큼, 기존 보안 업계 관행을 유지하면서도 AI가 만들어낼 수 있는 속도와 규모를 고려한 운영 프레임이 필요하다고 설명했다. 이 문서는 Anthropic가 open source software와 적절한 승인 하에 조사한 closed-source software에서 발견한 취약점에 적용되며, 외부 연구자가 Anthropic에 제보하는 경우에는 적용되지 않는다.

기본 규칙은 업계 표준과 유사한 90일 disclosure timeline이다. Anthropic는 취약점을 확인하면 가능한 한 빨리 vendor나 maintainer에게 통지하고, 특별한 보안상 이유가 없으면 90일이 지난 뒤 또는 patch가 배포된 뒤 방어자에게 세부 내용을 공개하겠다고 밝혔다. 다만 maintainer가 fix를 진행 중이면 14일 연장을 요청할 수 있고, 실제 악용 중인 critical 취약점의 경우에는 patch 또는 mitigation까지 7일을 목표로 하는 압축 일정이 적용된다. 또 여러 project에 걸친 ecosystem-wide pattern일 경우에는 관련 maintainer들에게 먼저 알리고 대응 시간을 보장한 뒤 공개하겠다는 방침도 포함됐다.

운영 방식에서도 AI 시대의 부담을 의식한 조항이 눈에 띈다. Anthropic는 maintainer가 30일 안에 초기 보고에 응답하지 않으면 외부 vulnerability coordinator로 사안을 escalate하고, 해당 timeline이 끝나면 공개 절차를 밟겠다고 했다. patch가 나온 뒤에는 보통 45일 동안 상세 기술 정보를 공개하지 않아 downstream 사용자가 배포할 시간을 확보한다는 원칙도 세웠다. 또한 AI가 생성한 보고서는 그 출처를 명확히 표기하고, 모든 보고는 인간 security researcher가 검토하고 확인한 뒤 전달한다고 밝혔다. source 접근이 가능한 경우 candidate patch도 함께 제공할 수 있다고 설명했다.

이번 정책은 AI 보안 연구가 실제 운영 단계로 들어가고 있다는 신호다. maintainers 입장에서는 취약점 보고가 늘어나는 것보다 낮은 품질의 보고가 대량으로 쏟아지는 상황이 더 큰 부담일 수 있다. Anthropic는 바로 그 문제를 의식해, maintainer가 감당할 수 있는 속도로 제출량을 조절하고 대량 투척식 제보를 지양하겠다고 적었다. Claude 같은 frontier model이 취약점 탐지에서 더 강해질수록, 시장은 모델 성능뿐 아니라 발견된 취약점을 어떻게 검증하고, 누구에게 언제 알리고, 언제 세부 내용을 공개할지 같은 운영 규범도 요구하게 된다. Anthropic의 이번 문서는 그 규범을 먼저 제시하려는 시도로 볼 수 있다.

Anthropic, Claude가 찾은 취약점 공개 원칙 수립

Related Articles

Anthropic, critical software 방어를 위한 Project Glasswing 공개

Anthropic, Claude가 찾은 취약점용 disclosure 원칙 공개

Anthropic, 美 중간선거 앞두고 Claude 선거 안전성 수치 공개

Comments (0)

Leave a Comment

Related Articles

Anthropic, critical software 방어를 위한 Project Glasswing 공개
AI Apr 12, 2026 1 min read

Anthropic, Claude가 찾은 취약점용 disclosure 원칙 공개
AI Mar 27, 2026 1 min read

Anthropic, 美 중간선거 앞두고 Claude 선거 안전성 수치 공개