Hacker News가 본 Claude Mythos Preview, cybersecurity capability의 기준을 바꾸다
Original: Assessing Claude Mythos Preview's cybersecurity capabilities View original →
2026년 4월 7일 Anthropic는 Claude Mythos Preview의 cybersecurity capability를 정리한 기술 글을 공개했다. 글의 핵심은 단순히 code generation이 더 좋아졌다는 수준이 아니라, reasoning·coding·autonomy가 결합되면서 실제 exploit 개발 단계까지 도달하는 성능이 나왔다는 점이다. Anthropic는 이 변화를 방어 측면에서 받아들이기 위해 Project Glasswing도 함께 시작했다.
가장 눈에 띄는 대목은 zero-day 관련 평가다. Anthropic는 Mythos Preview가 사용자의 지시 아래 major operating system과 major web browser 전반에서 zero-day vulnerability를 식별하고 exploit까지 만드는 사례를 확인했다고 설명했다. 공개 글은 99% 이상이 아직 patch되지 않았기 때문에 세부 사항을 숨기고 있지만, 이 자체가 평가가 toy benchmark가 아니라 실제 software target 위에서 진행됐다는 신호로 읽힌다.
공개된 수치도 강하다. Firefox JavaScript engine의 과거 취약점 집합을 활용한 benchmark에서 Opus 4.6은 수백 번 시도 중 두 번만 exploit을 만들었지만, Mythos Preview는 working exploit 181건과 register control 29건을 달성했다고 Anthropic는 밝혔다. OSS-Fuzz 기반 내부 평가에서도 약 1,000개 open-source repository, 약 7,000개 entry point를 대상으로 tier 1·2 crash 595건과 tier 5 control-flow hijack 10건을 기록했다고 한다.
이 글이 Hacker News에서 크게 반응한 이유는 보안 업계의 cost structure를 바꾸는 신호로 보이기 때문이다. model이 patching, triage, exploit explanation에 도움을 주는 만큼, 공격 측의 automation 비용도 함께 내려간다. 즉 frontier LLM의 일반 능력 향상이 security 영역에서 바로 operational consequence로 이어지기 시작했다는 뜻이다.
실무적으로는 두 가지 함의가 있다. 첫째, open-source maintainer와 vendor는 vulnerability response 속도를 더 끌어올려야 한다. 둘째, defensive workflow도 사람 중심 수작업에서 model-assisted review, fuzzing triage, patch prioritization 쪽으로 빠르게 이동할 가능성이 크다. Anthropic의 수치를 모두 그대로 받아들일지와 별개로, Hacker News가 읽은 메시지는 분명하다. 이제 “더 좋은 code model”이라는 표현만으로는 security risk를 설명하기 어려운 단계에 들어섰다.
Related Articles
Reuters 분석은 Mythos가 은행권에 먼 미래의 위험이 아니라 바로 지금의 patch timing 문제를 들이민다고 본다. 미국, Canada, Britain의 officials가 이미 금융권과 만났고, Anthropic은 이 모델이 high severity·critical severity 취약점을 thousands 단위로 찾아냈다고 설명했다.
Anthropic의 최첨단 AI Mythos가 17년간 전문가들이 놓쳤던 FreeBSD 원격 코드 실행 취약점을 자율적으로 발견하고 Firefox에서 약 300개의 버그를 추가 식별했다. 이 사건은 트럼프 행정부가 AI 사전 심사 제도 검토에 착수하는 직접적 계기가 됐다.
Anthropic과 KPMG가 5월 19일 글로벌 전략 동맹을 체결했다. KPMG 전 직원 27만 6천 명이 Digital Gateway를 통해 Claude에 접근하며, 조세·사모펀드·사이버보안 분야 에이전트 워크플로우에 우선 적용된다.
Comments (0)
No comments yet. Be the first to comment!