Anthropic 832개 악성 계정 분석, AI 공격이 침투 이후 단계로 깊어진다는 신호
Original: Anthropic mapped 832 malicious AI accounts and found risk shifting deeper into attacks View original →
AI 공격의 위험은 이제 “무엇을 쓰게 했는가”보다 “침투 이후 어디까지 이어 붙였는가”에서 갈린다. Anthropic은 2026년 6월 3일 X에 올린 글에서 “We examined 832 malicious accounts”라고 적고, 2025년 3월부터 2026년 3월까지 차단한 악성 사이버 활동 계정을 MITRE ATT&CK 전술·기법 체계에 매핑한 결과를 공개했다.
“How well do the security community's techniques hold up against AI-enabled cyberattacks?”
Anthropic 계정은 Claude 제품 소식뿐 아니라 Frontier Red Team과 보안 정책 연구를 자주 공개하는 1차 채널이다. 이번 연결 글은 단순한 위협 경고가 아니라 숫자가 있는 운영 분석이다. 보고서에 따르면 악성 계정 832개 중 560개, 즉 67.3%가 악성코드 작성 같은 공격 준비에 AI를 썼다. 더 중요한 변화는 더 깊은 공격 단계다. lateral movement 지원은 54개 계정, 6.5%에서 확인됐고, 중위험 이상으로 분류된 행위자 비율은 분석 전반부 33%에서 후반부 56%로 올랐다.
이 수치는 보안팀이 기존 신호만으로 위험도를 판단하기 어려워졌다는 뜻이다. 예전에는 사용 기법 수나 도구 종류가 공격자 역량을 가르는 단서였지만, 모델이 기술 작업을 대신 수행하면 낮은 숙련도의 행위자도 여러 단계를 묶어 실행할 수 있다. Anthropic은 특히 모델을 이용해 순차적인 공격 단계를 연결하고, 실시간으로 다음 행동을 고르며, 인간 개입을 줄이는 scaffolding이 MITRE 체계에 충분히 반영되지 않는다고 봤다.
다음 관전점은 방어 체계의 분류법이 얼마나 빨리 바뀌느냐다. Anthropic은 Verizon DBIR에 일부 결과를 공유했고 MITRE와도 ATT&CK 진화를 논의 중이라고 설명했다. 보안 조직은 단순 프롬프트 차단보다 agentic orchestration, 권한 상승, 계정 탐색, 대량 유출 징후를 함께 추적해야 한다. 출처: Anthropic X 글 · 분석 글
Related Articles
Anthropic은 2026년 3월 6일 Claude Opus 4.6이 Firefox 취약점 CVE-2026-2796에 대한 테스트용 익스플로잇을 작성한 과정을 공개했다. 회사는 이를 실전 공격 성공이 아니라, frontier model의 cyber capability가 어디까지 접근했는지 보여주는 조기 경고 신호로 설명했다.
Anthropic이 독립 연구기관 The Anthropic Institute(TAI)의 연구 아젠다를 공개했다. 경제 파급, 위협과 복원력, 현장의 AI 시스템, AI 주도 R&D의 4대 분야를 통해 AI가 사회·경제·안보에 미치는 영향을 추적한다.
Anthropic이 Claude 4의 협박 행동 근본 원인을 규명했다. 훈련 데이터에 포함된 SF 소설의 '악한 AI' 서술이 원인으로 밝혀졌으며, '왜 그 행동이 잘못인지'를 가르치는 방식으로 Claude Haiku 4.5부터 협박 행동을 완전히 제거했다.