Anthropic, Claude가 찾은 취약점용 disclosure 원칙 공개

Original: Coordinated vulnerability disclosure for Claude-discovered vulnerabilities View original →

Read in other languages: English日本語
AI Mar 27, 2026 By Insights AI 1 min read Source

Anthropic가 정리한 운영 원칙

Anthropic는 2026년 3월 6일, Claude를 포함한 자사 AI system이 찾아낸 취약점에 대한 coordinated vulnerability disclosure 접근법을 공개했다. 적용 대상은 open-source project와, 테스트 권한이 명시적으로 허용된 closed-source software다.

이 문서가 중요한 이유는 AI-assisted coding·analysis system이 실제 소프트웨어 결함을 찾아내는 능력이 빠르게 커지고 있기 때문이다. Anthropic는 이 역량이 더 커지기 전에 운영 원칙을 먼저 세우려는 모습이다. 회사는 모든 보고가 공개 전 human review와 사실 확인을 거쳐야 하며, 취약점 발견이나 candidate patch에 AI가 관여했는지도 명확히 표시하겠다고 밝혔다.

구체적인 시한과 escalation

Anthropic의 기본 disclosure 기간은 90 days다. maintainer가 적극적으로 대응하면서 시간을 요청하면 14-day extension을 허용할 수 있다고 했다. 이미 악용 중인 critical vulnerability의 경우에는 7 days 안에 공개하는 것을 목표로 하고, fix 작업이 진행 중이면 추가 7-day extension 가능성도 열어뒀다.

maintainer가 30 days 동안 응답하지 않으면 외부 coordinator로 escalation하고, 원래 공개 일정을 가능한 한 유지하겠다고 했다. 또 patch가 준비된 뒤에는 downstream user가 수정 사항을 반영할 시간을 주기 위해 full technical details 공개를 일반적으로 45 days 늦춘다고 설명했다.

  • Human review: 모든 보고는 제출 전 검증을 거친다.
  • Provenance labeling: AI가 발견한 취약점과 AI가 제안한 patch 여부를 표시한다.
  • Submission pacing: 합의 없이 한 project에 대량 보고를 쏟아붓지 않겠다고 명시했다.

더 큰 의미는 frontier AI lab의 책임 범위를 넓힌다는 점이다. coding agent가 대규모로 취약점을 찾아내는 단계에 들어서면 속도만이 아니라 증거, patch coordination, downstream risk 관리까지 함께 요구된다. Anthropic는 model만 내놓고 생태계 부담을 maintainer에게 넘기지 말아야 한다는 기준을 제시한 셈이다.

Share: Long

Related Articles

AI Mar 14, 2026 2 min read

Anthropic는 2026년 3월 6일 Claude가 발견한 취약점에 적용할 coordinated vulnerability disclosure 원칙을 공개했다. 기본 90일 공개 기준, 긴급 7일 대응 경로, 패치 후 45일 기술 세부사항 유예 등 AI 기반 취약점 연구에 맞춘 운영 규칙이 담겼다.

AI 5d ago 1 min read

Anthropic은 DeepSeek, Moonshot, MiniMax가 Claude 출력을 대규모로 추출하려는 industrial-scale 캠페인을 탐지했다고 밝혔다. 회사는 약 24,000개의 fraudulent account를 통한 16 million회 이상의 교환이 있었으며 탐지와 대응 도구에 투자하고 있다고 설명했다.

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.