Anthropic, AI 기반 취약점 검토를 위한 Claude Code Security 프리뷰 공개
Original: Making frontier cybersecurity capabilities available to defenders View original →
Anthropic가 cyberdefense 연구를 제품으로 옮기기 시작했다
Anthropic는 2026년 2월 20일 Claude Code Security를 Claude Code 웹 버전의 limited research preview로 공개했다. 회사 설명에 따르면 이 기능은 코드베이스를 스캔해 security vulnerability를 찾고, 사람이 검토할 수 있도록 targeted software patch를 제안한다. 초기 제공 대상은 Enterprise와 Team 고객이며, open-source 저장소 maintainers에게는 expedited access도 제공한다.
문제의식은 분명하다. security team은 점점 더 많은 코드와 취약점을 상대하지만, 미묘한 문제를 끝까지 조사할 전문 인력은 충분하지 않다. Anthropic는 기존 static analysis 도구가 알려진 패턴을 찾는 데는 유용하지만, broken access control이나 business-logic flaw처럼 맥락 의존적인 취약점은 자주 놓친다고 본다.
기존 static analysis와 무엇이 다른가
Anthropic 설명에 따르면 Claude Code Security는 단순 signature matching에 머물지 않는다. 사람 security researcher처럼 코드를 읽고, 구성 요소가 어떻게 상호작용하는지, 데이터가 애플리케이션 내부를 어떻게 이동하는지를 추적한다. 이런 넓은 맥락 이해를 통해, 개별 파일이나 규칙 기반 검사만으로는 드러나지 않는 취약점을 더 잘 찾아내겠다는 것이다.
또한 Anthropic는 모든 결과가 analyst에게 도달하기 전에 multi-stage verification을 거친다고 밝혔다. Claude가 스스로 결과를 반박하거나 입증하려 시도하고, severity와 confidence를 매긴 뒤, 검증된 결과만 dashboard에 노출한다. 거기서 팀은 제안된 수정안을 검토할 수 있다. 회사는 어떤 patch도 자동 적용되지 않으며, 최종 판단은 여전히 개발자가 내린다고 강조했다.
발표의 근거로 제시된 연구 성과
이번 preview는 1년 이상 진행된 내부 cybersecurity 연구 위에 세워졌다고 Anthropic는 설명한다. 회사는 Frontier Red Team이 competitive Capture-the-Flag 행사에 Claude를 투입했고, Pacific Northwest National Laboratory와 critical infrastructure 방어 실험도 진행했으며, 장기간에 걸쳐 취약점 탐지·수정 워크플로를 다듬어 왔다고 밝혔다. 특히 Claude Opus 4.6을 활용해 production open-source codebases에서 500개가 넘는 vulnerabilities를 찾았고, 그중 일부는 수십 년간 발견되지 않았던 버그였다고 주장했다.
이 수치는 상당히 공격적인 주장이고, Anthropic 역시 현재 triage와 responsible disclosure가 진행 중이라고 적었다. 그럼에도 이번 출시는, AI 보안 연구가 데모 단계를 넘어 실제 개발 프로세스 안에서 시험할 수 있는 defender workflow로 이동하고 있다는 점에서 의미가 크다.
왜 지금 중요한가
Anthropic의 논리는 간단하다. AI는 공격자와 방어자 모두에게 쓰일 것이며, 모델이 exploitable weakness를 더 잘 찾게 될수록 defender도 비슷한 능력을 검증·거버넌스·human approval과 함께 가져야 한다는 것이다. Claude Code Security는 그 주장을 red-team 실험 수준이 아니라 제품 수준에서 구현하려는 첫 시도에 가깝다.
출처: Anthropic 공식 발표.
Related Articles
r/singularity는 Firefox에서 271건을 잡았다는 숫자보다, 앞으로 브라우저와 대형 코드베이스가 거의 상시 패치 모드로 들어갈 수 있다는 점에 더 크게 반응했다. 댓글도 야간 보안 릴리스가 기본이 되는 것 아니냐는 불안과 현실론이 섞였다.
Anthropic는 X에서 Project Glasswing을 소개했고, 2026년 4월 7일 공식 페이지에서 critical software security initiative의 구조를 공개했다. 이 프로그램은 Claude Mythos Preview를 활용해 주요 인프라 조직과 오픈소스 유지보수자에게 방어 측 우위를 먼저 제공하겠다는 점이 핵심이다.
r/artificial의 최근 글은 Claude Code leak를 단순 해프닝이 아니라 AI agent 설계 교본처럼 읽어야 한다는 관점을 제시했다. 핵심은 model weights가 아니라 memory, permissions, tool orchestration, multi-agent coordination 같은 실제 product layer가 드러났다는 점이다.
Comments (0)
No comments yet. Be the first to comment!