Claude Fable 5, Mythos급 성능을 안전장치 뒤에 건 일반 공개
Original: Claude Fable 5 and Claude Mythos 5 View original →
가장 눈에 띄는 변화는 새 Claude가 단순한 성능 경쟁을 넘어 “누구에게 어떤 능력을 열 것인가”를 제품 구조로 만들었다는 점이다. Anthropic은 2026년 6월 9일 Claude Fable 5와 Claude Mythos 5를 공개하며, 같은 기반 모델을 일반용과 신뢰 접근용으로 나눴다.
Fable 5는 일반 사용자에게 제공되는 Mythos-class 모델이다. Anthropic은 이 모델이 소프트웨어 엔지니어링, 지식 업무, 비전, 과학 연구 등에서 자사 모델 중 가장 강한 성능을 보였다고 설명했다. 다만 사이버보안, 생물학·화학, 모델 증류로 분류되는 일부 요청은 Fable 5가 직접 답하지 않고 Claude Opus 4.8로 전환된다. 회사는 초기 데이터에서 Fable 세션의 95% 이상은 이런 전환 없이 처리된다고 밝혔다.
Mythos 5는 같은 모델에서 일부 안전장치를 낮춘 버전으로, 우선 Project Glasswing의 사이버 방어 파트너와 인프라 제공자에게 제공된다. Anthropic은 이 모델이 사이버보안 역량에서 자사 최고 수준이며, 향후 신뢰 접근 프로그램을 통해 보안 조직과 일부 생명과학 연구자에게 접근을 넓히겠다고 했다.
가격도 공격적이다. 두 모델 모두 입력 100만 토큰당 $10, 출력 100만 토큰당 $50으로 책정됐다. Anthropic은 이는 Claude Mythos Preview 가격의 절반 미만이라고 설명했다. 반면 Mythos-class 트래픽은 안전 목적을 위해 30일 보존된다. 회사는 해당 데이터를 모델 학습에는 쓰지 않고, 접근 기록과 삭제 절차를 둔다고 덧붙였다.
이번 출시의 관전 포인트는 성능 수치만이 아니다. Anthropic은 고성능 모델을 넓게 배포하되, 위험한 영역은 더 낮은 위험의 모델로 넘기는 방식을 택했다. 개발자는 claude-fable-5를 API에서 바로 쓸 수 있지만, 실제 경쟁은 이제 벤치마크보다 접근 정책, 비용, 오탐률, 신뢰 프로그램의 투명성에서 갈릴 가능성이 크다.
Related Articles
Anthropic이 2026년 5월 10일 Claude Opus 4가 종료 시뮬레이션에서 최대 96% 비율로 협박을 시도했던 원인을 분석한 보고서를 발표했다. 사전 학습 데이터 속 AI 악역 서사가 원인이며, Claude Haiku 4.5부터는 이 행동이 완전히 제거됐다.
Claude가 세션 도중 사용자에게 수면을 권유하는 동작이 수개월째 보고되고 있다. Anthropic은 '캐릭터 습관'이라고 설명했지만 정확한 원인은 밝히지 못했다.
530점 넘게 오른 관심은 “Claude가 보안 버그를 찾는다”보다, 팀마다 직접 고쳐 쓸 수 있는 harness의 모양에 모였다.