작은 Open model도 Mythos 핵심 취약점 분석을 재현했다
Original: Small models also found the vulnerabilities that Mythos found View original →
무슨 이야기인가
2026년 4월 7일 공개된 AISLE의 글은 2026년 4월 12일 기준 Hacker News에서 802 points와 218 comments를 모았다. 글은 Anthropic의 Mythos Preview와 Project Glasswing 발표를 정면으로 다룬다. Anthropic은 제한 접근형 AI가 핵심 소프트웨어에서 심각한 취약점을 찾고 exploit까지 만들 수 있다고 강조했지만, AISLE은 공개된 근거가 특정 frontier model의 독점력보다 주변 시스템 설계를 더 많이 보여준다고 본다.
AISLE이 제시한 핵심은 AI 보안 작업을 하나의 능력으로 뭉뚱그리지 않는 것이다. 이들은 대규모 codebase 탐색, 취약점 식별, false positive 판별, patch 생성, exploit 구성은 서로 다른 작업이며 scaling 방식도 다르다고 본다. 그래서 관련 코드 경로를 먼저 좁힌 뒤 평가했을 때, 작은 model도 예상보다 강하게 작동했다는 것이 글의 요지다.
글에서 제시한 근거
- 8개 model 모두 Mythos의 대표 사례로 제시된 FreeBSD NFS 취약점을 탐지했다고 AISLE은 설명한다.
- 그중에는 3.6B active parameters 규모의 model도 있었고, 비용은 1M tokens당 $0.11 수준이었다.
- 5.1B-active open model은 오래된 OpenBSD SACK bug의 핵심 분석 체인을 복원했다고 한다.
- 기초 보안 추론 과제에서는 작은 open model이 여러 frontier model보다 더 나은 결과를 낸 사례도 제시됐다.
왜 중요하나
AISLE도 이 실험이 저장소 전체를 완전 자율로 훑는 end-to-end test는 아니었다고 분명히 밝힌다. 그럼에도 이 글은 AI security economics에 중요한 질문을 던진다. 능력이 매끄럽게 늘어나는 것이 아니라 과제별로 jagged하다면, 실제 경쟁력은 model size만이 아니라 orchestration, validation, throughput, 그리고 maintainer trust에서 나온다는 뜻이기 때문이다. 방어자 입장에서는 비싼 단일 model 하나에 의존하기보다 더 저렴한 model을 넓게 배치해 coverage를 확보하는 전략이 현실적일 수 있다는 시사점이 나온다.
원문: AISLE. Hacker News 토론: discussion thread.
Related Articles
LocalLLaMA에서 큰 반응을 얻은 글은 Anthropic Mythos가 예시로 든 취약점 분석 일부를 더 작고 저렴한 open 또는 low-cost model도 상당 부분 재현할 수 있다고 주장했다. 다만 댓글은 취약 코드를 이미 좁혀 놓은 상태의 reasoning과, 실제 대규모 코드베이스에서 그 버그를 찾아내는 일은 전혀 다르다고 선을 그었다.
Anthropic는 X에서 Project Glasswing을 소개했고, 2026년 4월 7일 공식 페이지에서 critical software security initiative의 구조를 공개했다. 이 프로그램은 Claude Mythos Preview를 활용해 주요 인프라 조직과 오픈소스 유지보수자에게 방어 측 우위를 먼저 제공하겠다는 점이 핵심이다.
Microsoft는 2026 through 2029 기간 일본에 $10 billion을 투자해 AI 인프라, cybersecurity 협력, workforce development를 확대하겠다고 밝혔다. 계획에는 일본 내 데이터 거주성을 유지하는 GPU 기반 Azure 옵션과 2030년까지 1 million명 이상의 엔지니어·개발자·근로자를 대상으로 한 교육이 포함된다.
Comments (0)
No comments yet. Be the first to comment!