Anthropic Mythos 유출, 스스로 키운 초강력 보안 서사를 이번에 정면으로 무너뜨리다
Original: The Verge said the Mythos breach undercut Anthropic’s security posture after day-one unauthorized access claims View original →
트윗이 드러낸 것
The Verge의 트윗은 짧지만 방향은 분명했다. Anthropic’s Mythos breach was humiliating. vendor account의 product post와 달리, 이것은 보도 신호다. Verge 계정은 자체 기사와 해설을 밀어 올리는 채널이기 때문에, 핵심은 제품 예고가 아니라 Mythos를 둘러싼 보안 우려가 공개적인 breach narrative로 굳어졌다는 데 있다.
linked report가 전한 내용
연결된 Verge 기사에 따르면 Anthropic의 보안 태세는 그리 고도화되지 않은 실패로 흔들렸다. Bloomberg를 인용해, 소수의 unauthorized user가 Anthropic이 제한된 기업에 Mythos를 제공하기 시작한 첫날부터 모델에 접근했다고 적는다. 기사 설명을 따르면, 이들은 Mercor breach에서 드러난 정보와 모델 평가 contractor access를 조합해 Mythos의 위치를 추정했다. 문제는 Anthropic이 Mythos를 “watershed moment for security”라고 부르며 모든 주요 operating system과 web browser에서 취약점을 찾을 수 있는 모델처럼 설명해 왔다는 점이다.
기사의 또 다른 포인트는 이것이 첫 노출이 아니라는 데 있다. Mythos는 이미 release 전에 website content 관련 unsecured data trove를 통해 존재가 드러난 적이 있다. 그러니 진짜 문제는 단순히 접근이 일어났다는 사실만이 아니다. AI safety를 정체성으로 내세운 회사가 강하게 제한된 모델을 너무 뻔한 표적으로 만들었고, 침입을 먼저 포착하지도 못했다는 점이다. 기사에는 Anthropic이 사용 기록을 log·track할 수 있었다는 내용도 등장해, 왜 더 빨리 감지하지 못했는지 의문을 남긴다.
다음 관전 포인트
이제 필요한 것은 Anthropic의 상세 incident 설명, contractor·supply chain 통제 강화, 그리고 앞으로 Mythos access를 어떻게 모니터링할지에 대한 구체적 공개다. 더 큰 질문도 남는다. frontier lab들은 보안을 브랜드이자 release rationale의 일부로 사용하고 있는데, 이런 incident는 그 언어를 실제 운영 discipline과 대조 가능한 대상으로 바꿔버린다.
Sources: X source tweet · The Verge report · WSJTech tweet on unauthorized access
Related Articles
Calif 연구팀이 Anthropic의 Mythos Preview AI와 협력해 Apple M5 실리콘의 Memory Integrity Enforcement(MIE)를 우회하는 최초 공개 커널 메모리 손상 익스플로잇을 단 5일 만에 개발했다. Apple이 5년에 걸쳐 구축한 핵심 보안 시스템이 AI 지원으로 단기간에 뚫렸다.
Cloudflare가 Anthropic의 보안 특화 모델 Mythos Preview를 자사 인프라에 실전 테스트한 결과를 공개했다. Mythos는 개별 저위험 버그들을 연결해 실제로 동작하는 익스플로잇을 생성할 수 있으며, 이는 시니어 보안 연구자 수준의 추론 능력을 보여준다.
AI 보안의 쟁점이 피싱 작성에서 침투 이후 자동화로 이동하고 있다. Anthropic은 832개 악성 계정을 MITRE ATT&CK에 매핑했고, 중위험 이상 행위자 비율이 33%에서 56%로 뛰었다고 밝혔다.