Anthropic, AI 기반 취약점 검토를 위한 Claude Code Security 프리뷰 공개
Original: Making frontier cybersecurity capabilities available to defenders View original →
Anthropic가 cyberdefense 연구를 제품으로 옮기기 시작했다
Anthropic는 2026년 2월 20일 Claude Code Security를 Claude Code 웹 버전의 limited research preview로 공개했다. 회사 설명에 따르면 이 기능은 코드베이스를 스캔해 security vulnerability를 찾고, 사람이 검토할 수 있도록 targeted software patch를 제안한다. 초기 제공 대상은 Enterprise와 Team 고객이며, open-source 저장소 maintainers에게는 expedited access도 제공한다.
문제의식은 분명하다. security team은 점점 더 많은 코드와 취약점을 상대하지만, 미묘한 문제를 끝까지 조사할 전문 인력은 충분하지 않다. Anthropic는 기존 static analysis 도구가 알려진 패턴을 찾는 데는 유용하지만, broken access control이나 business-logic flaw처럼 맥락 의존적인 취약점은 자주 놓친다고 본다.
기존 static analysis와 무엇이 다른가
Anthropic 설명에 따르면 Claude Code Security는 단순 signature matching에 머물지 않는다. 사람 security researcher처럼 코드를 읽고, 구성 요소가 어떻게 상호작용하는지, 데이터가 애플리케이션 내부를 어떻게 이동하는지를 추적한다. 이런 넓은 맥락 이해를 통해, 개별 파일이나 규칙 기반 검사만으로는 드러나지 않는 취약점을 더 잘 찾아내겠다는 것이다.
또한 Anthropic는 모든 결과가 analyst에게 도달하기 전에 multi-stage verification을 거친다고 밝혔다. Claude가 스스로 결과를 반박하거나 입증하려 시도하고, severity와 confidence를 매긴 뒤, 검증된 결과만 dashboard에 노출한다. 거기서 팀은 제안된 수정안을 검토할 수 있다. 회사는 어떤 patch도 자동 적용되지 않으며, 최종 판단은 여전히 개발자가 내린다고 강조했다.
발표의 근거로 제시된 연구 성과
이번 preview는 1년 이상 진행된 내부 cybersecurity 연구 위에 세워졌다고 Anthropic는 설명한다. 회사는 Frontier Red Team이 competitive Capture-the-Flag 행사에 Claude를 투입했고, Pacific Northwest National Laboratory와 critical infrastructure 방어 실험도 진행했으며, 장기간에 걸쳐 취약점 탐지·수정 워크플로를 다듬어 왔다고 밝혔다. 특히 Claude Opus 4.6을 활용해 production open-source codebases에서 500개가 넘는 vulnerabilities를 찾았고, 그중 일부는 수십 년간 발견되지 않았던 버그였다고 주장했다.
이 수치는 상당히 공격적인 주장이고, Anthropic 역시 현재 triage와 responsible disclosure가 진행 중이라고 적었다. 그럼에도 이번 출시는, AI 보안 연구가 데모 단계를 넘어 실제 개발 프로세스 안에서 시험할 수 있는 defender workflow로 이동하고 있다는 점에서 의미가 크다.
왜 지금 중요한가
Anthropic의 논리는 간단하다. AI는 공격자와 방어자 모두에게 쓰일 것이며, 모델이 exploitable weakness를 더 잘 찾게 될수록 defender도 비슷한 능력을 검증·거버넌스·human approval과 함께 가져야 한다는 것이다. Claude Code Security는 그 주장을 red-team 실험 수준이 아니라 제품 수준에서 구현하려는 첫 시도에 가깝다.
출처: Anthropic 공식 발표.
Related Articles
Hacker News에서 크게 확산된 Anthropic-Mozilla 협업 사례는 Claude Opus 4.6가 Firefox에서 22개의 취약점을 찾고 14개가 high-severity로 분류됐다는 점을 공개했다. 핵심은 자율 마법이 아니라 verifier와 triage를 갖춘 defender workflow가 빨라진다는 데 있다.
Anthropic은 2026년 3월 6일 Claude Opus 4.6이 Firefox 취약점 CVE-2026-2796에 대한 테스트용 익스플로잇을 작성한 과정을 공개했다. 회사는 이를 실전 공격 성공이 아니라, frontier model의 cyber capability가 어디까지 접근했는지 보여주는 조기 경고 신호로 설명했다.
Anthropic는 powerful AI가 사회에 던질 과제를 다루는 공익 조직 The Anthropic Institute를 출범시켰다. 회사는 이 조직이 technical·economic·social science 관점을 결합해 public conversation을 넓히는 역할을 맡는다고 밝혔다.
Comments (0)
No comments yet. Be the first to comment!