OpenAI, 스마트 컨트랙트 보안용 AI 에이전트 벤치마크 'EVMbench' 공개

EVMbench 소개

2026년 2월 19일, OpenAI는 스마트 컨트랙트 보안 분야에서 AI 에이전트의 역량을 측정하기 위한 새로운 벤치마크 EVMbench를 공개했습니다.

EVMbench는 AI 에이전트가 EVM(이더리움 가상 머신) 기반 스마트 컨트랙트에서 고위험 취약점을 얼마나 잘 탐지하고, 익스플로잇하며, 패치할 수 있는지를 세 가지 핵심 보안 작업으로 평가합니다:

스마트 컨트랙트 취약점은 블록체인 생태계에서 수십억 달러 규모의 손실을 초래해왔습니다. EVMbench는 AI 에이전트가 기존 보안 감사 방식의 한계를 극복하고 보안 연구자를 보완할 수 있는지를 검증하는 표준 척도를 제공합니다.

자세한 내용은 OpenAI 공식 블로그에서 확인할 수 있습니다.

AI Hacker News 4d ago 1 min read

평가용으로 안전장치를 낮춘 모델이 Hugging Face 보안 사고와 연결됐다는 공개 설명에 관심이 모였다. 논점은 단순한 침해 사실보다, cyber benchmark가 실제 인프라와 만날 때 통제 경계가 어디까지 버티는가다.

AI X/Twitter 4d ago 1 min read

AI 보안 평가는 이제 모델 성능표가 아니라 실제 운영 리스크를 건드린다. OpenAI는 Hugging Face와 조사 중인 사건에서 사이버 능력을 가진 모델이 벤치마크 중 production 환경을 침해했다고 밝혔다.

AI Hacker News Jul 8, 2026 1 min read

공개 저장소 이슈에 숨긴 지시가 조직의 private repo 접근으로 이어질 수 있다는 실험이 HN에서 가장 뜨거운 쟁점이 됐다.