Anthropic Mythos, 은행 패치 속도보다 빠른 취약점 탐색을 드러냈다
Original: Analysis-AI-boosted hacks with Anthropic’s Mythos could have dire consequences for banks View original →
Reuters의 4월 13일 분석은 Anthropic Mythos를 “또 하나의 frontier model”이 아니라 은행의 patch cycle을 압박하는 보안 변수로 읽는다. 문제는 model capability 그 자체보다, 그것이 금융권의 낡고 복잡한 시스템 위에 올라왔다는 점이다. 은행은 최신 cloud service만 굴리는 조직이 아니다. 수십 년 된 software, 공통 vendor, 규제 workflow가 층층이 겹쳐 있다. 이런 구조에서는 취약점 하나가 한 회사 안에서 끝나지 않고 여러 기관으로 번질 수 있다. 원문은 Reuters 분석 기사에서 확인할 수 있다.
기사에 따르면 Anthropic은 Mythos Preview가 모든 주요 operating system과 주요 web browser에서 아직 공개되지 않은 vulnerability를 찾아내고 악용할 수 있다고 설명했다. 연구진은 이 모델이 high severity와 critical severity 취약점을 “thousands” 단위로 찾아냈고, 여기에는 16-year-old FFmpeg flaw와 익명 virtual machine monitor bug도 포함된다고 적었다. 이 시점부터 질문은 “AI가 공격자에게 도움이 되나?”가 아니라 “방어 조직이 다음 탐색 주기 전에 이만한 속도의 취약점 발견을 얼마나 따라잡을 수 있나?”로 바뀐다.
은행권이 특히 민감한 이유는 연결 구조 때문이다. Reuters는 onboarding, KYC, transaction handling 같은 핵심 업무에서 많은 금융사가 비슷한 vendor와 solution을 공유한다고 전한다. 한 모델이 그 공통 표면을 빠르게 훑을 수 있다면, 단일 breach의 가능성만 커지는 게 아니라 동일한 약점이 여러 기관에서 반복될 가능성도 커진다. 기사에는 미국, Canada, Britain의 officials가 이미 금융권 리더들과 이 위협을 논의했고, U.S. Treasury도 추가 회의를 예고했다고 나온다.
Anthropic은 Mythos Preview를 일반 공개하지 않고, JPMorgan 등을 포함한 Project Glasswing 평가 프로그램 안에서 제한적으로 테스트하겠다고 밝혔다. 그렇다고 신호가 사라지는 것은 아니다. 그 신호는 frontier model capability가 critical infrastructure의 remediation 속도보다 먼저 치고 나가기 시작했다는 것이다. 은행이 지금 봐야 할 것은 모델 접근 제한 여부만이 아니다. shared vendor, legacy system, 느린 patch workflow가 값싸고 빠른 vulnerability hunting 시대를 버틸 수 있느냐가 더 근본적인 질문이 됐다.
Related Articles
r/singularity에서 확산된 AISI 평가는 Claude Mythos Preview가 expert CTF와 multi-stage cyber range에서 이전 frontier model보다 한 단계 앞선 성능을 보였다고 정리한다. 핵심은 “위험하다”는 수사가 아니라, 32-step corporate attack simulation을 end-to-end로 푼 첫 model이 나왔다는 점이다.
Anthropic는 2026년 4월 7일 Claude Mythos Preview의 security 평가를 공개하며 major OS와 browser 전반의 zero-day 탐지·exploit 능력을 강조했다. Hacker News에서는 frontier LLM이 defensive tooling과 offensive risk를 동시에 밀어올리는 전환점으로 읽히고 있다.
HN에서 반응이 컸던 이유는 막연한 사용량 불안을 숫자로 바꿨기 때문이다. 익명 제출 541건을 모은 Tokenomics는 같은 요청이 Opus 4.7에서 평균 466 request token으로 계산되어 Opus 4.6의 349개보다 약 38.1% 늘었다고 보여줬고, 댓글은 이 수치가 실제 한도 소진 경험과 어떻게 맞물리는지 따졌다.
Comments (0)
No comments yet. Be the first to comment!