OpenAI、スマートコントラクトセキュリティ向けAIエージェントベンチマーク「EVMbench」を発表
Original: OpenAI Introduces EVMbench: A Benchmark for AI Agents in Smart Contract Security View original →
EVMbenchの概要
2026年2月19日、OpenAIはAIエージェントのスマートコントラクトセキュリティ能力を評価する新ベンチマークEVMbenchを発表しました。
EVMbenchが測定するもの
EVMbenchは、EVM(イーサリアム仮想マシン)ベースのスマートコントラクトに対してAIエージェントが以下の3つのセキュリティタスクをどれだけ実行できるかを評価します:
- 検出:デプロイ済みコントラクトの重大な脆弱性を特定
- 悪用:脆弱性がどのように引き起こされるかのデモンストレーション
- パッチ:効果的でセキュアな修正の生成
重要性
スマートコントラクトの脆弱性はブロックチェーンエコシステム全体で数十億ドルの損失をもたらしてきました。EVMbenchはAIエージェントがセキュリティ研究者を補完し、重大な欠陥の発見と修正を加速できるかを標準的に評価する枠組みを提供します。
詳細はOpenAI公式ブログをご覧ください。
Related Articles
OpenAIが、EVMベースのスマートコントラクトにおける高リスク脆弱性の検出・悪用・パッチ能力をAIエージェントで測定する新ベンチマーク「EVMbench」を公開しました。
OpenAIが、EVMベースのスマートコントラクトにおける高リスク脆弱性の検出・悪用・パッチ能力をAIエージェントで測定する新ベンチマーク「EVMbench」を公開しました。
OpenAIは3月9日にXで、AI security platform の Promptfoo を買収する計画を明らかにした。Promptfoo は open source を維持し、今回の取引は OpenAI Frontier の agentic testing・evaluation stack を強化する位置づけだ。
Comments (0)
No comments yet. Be the first to comment!