OpenAI, 스마트 컨트랙트 보안용 AI 에이전트 벤치마크 'EVMbench' 공개
Original: OpenAI Introduces EVMbench: A Benchmark for AI Agents in Smart Contract Security View original →
EVMbench 소개
2026년 2월 19일, OpenAI는 스마트 컨트랙트 보안 분야에서 AI 에이전트의 역량을 측정하기 위한 새로운 벤치마크 EVMbench를 공개했습니다.
EVMbench란?
EVMbench는 AI 에이전트가 EVM(이더리움 가상 머신) 기반 스마트 컨트랙트에서 고위험 취약점을 얼마나 잘 탐지하고, 익스플로잇하며, 패치할 수 있는지를 세 가지 핵심 보안 작업으로 평가합니다:
- 탐지: 배포된 컨트랙트의 심각한 취약점 식별
- 익스플로잇: 취약점이 어떻게 발현되는지 실증
- 패치: 효과적이고 안전한 수정 코드 생성
보안 분야에서의 AI 활용
스마트 컨트랙트 취약점은 블록체인 생태계에서 수십억 달러 규모의 손실을 초래해왔습니다. EVMbench는 AI 에이전트가 기존 보안 감사 방식의 한계를 극복하고 보안 연구자를 보완할 수 있는지를 검증하는 표준 척도를 제공합니다.
자세한 내용은 OpenAI 공식 블로그에서 확인할 수 있습니다.
Related Articles
주정부별 frontier AI 법안이 연방 표준의 출발점으로 올라섰다. OpenAI는 CAISI를 상설 평가기관으로 키우고, 고위험 모델에 독립 감사와 사고 보고, 모델 가중치 보안 의무를 붙이는 3단계 청사진을 제시했다.
npm, PyPI, Crates.io에 걸친 34개 악성 패키지가 지갑 파일, SSH 키, 클라우드 토큰을 노렸다. 더 큰 쟁점은 .cursorrules와 CLAUDE.md까지 건드려 AI 코딩 도구가 공격자의 지시를 읽게 만들려 했다는 점이다.
개인화 AI의 경쟁축이 대화창 안 답변에서 장기 기억 품질로 이동한다. OpenAI는 미국 Plus·Pro 사용자에게 새 메모리를 먼저 적용하고, Free 확장을 위해 연산 비용을 약 5배 낮췄다고 설명했다.