AI Reddit May 2, 2026 1 min read
영국 AI 안전 연구소(AISI)가 OpenAI GPT-5.5의 사이버 역량 평가 결과를 공개했다. GPT-5.5는 인간 전문가 12시간짜리 복잡한 기업 네트워크 침투 시뮬레이션을 단 11분, $1.73 비용으로 완료했다. Anthropic Claude Mythos에 이어 이 기준을 통과한 두 번째 모델로, AI 사이버 역량이 전반적 추세로 확산 중임을 보여준다.
영국 AI 안전 연구소(AISI)가 OpenAI GPT-5.5의 사이버 역량 평가 결과를 공개했다. GPT-5.5는 인간 전문가 12시간짜리 복잡한 기업 네트워크 침투 시뮬레이션을 단 11분, $1.73 비용으로 완료했다. Anthropic Claude Mythos에 이어 이 기준을 통과한 두 번째 모델로, AI 사이버 역량이 전반적 추세로 확산 중임을 보여준다.
이 스레드는 “GPT-5.5가 강하다”에서 끝나지 않았다. Reddit 제목은 12시간·11분으로 돌았지만, 공식 수치는 20시간짜리 end-to-end 체인과 10분 22초짜리 별도 과제를 섞은 것이었고, 댓글은 바로 그 비용·재현성 문제에 달라붙었다.
r/singularity에서 확산된 AISI 평가는 Claude Mythos Preview가 expert CTF와 multi-stage cyber range에서 이전 frontier model보다 한 단계 앞선 성능을 보였다고 정리한다. 핵심은 “위험하다”는 수사가 아니라, 32-step corporate attack simulation을 end-to-end로 푼 첫 model이 나왔다는 점이다.