OpenAI、スマートコントラクトセキュリティ向けAIエージェントベンチマーク「EVMbench」を発表

EVMbenchの概要

2026年2月19日、OpenAIはAIエージェントのスマートコントラクトセキュリティ能力を評価する新ベンチマークEVMbenchを発表しました。

EVMbenchは、EVM（イーサリアム仮想マシン）ベースのスマートコントラクトに対してAIエージェントが以下の3つのセキュリティタスクをどれだけ実行できるかを評価します：

スマートコントラクトの脆弱性はブロックチェーンエコシステム全体で数十億ドルの損失をもたらしてきました。EVMbenchはAIエージェントがセキュリティ研究者を補完し、重大な欠陥の発見と修正を加速できるかを標準的に評価する枠組みを提供します。

詳細はOpenAI公式ブログをご覧ください。

AI sources.twitter Feb 24, 2026 1 min read

OpenAIが、EVMベースのスマートコントラクトにおける高リスク脆弱性の検出・悪用・パッチ能力をAIエージェントで測定する新ベンチマーク「EVMbench」を公開しました。

AI sources.twitter Feb 24, 2026 1 min read

AI 2d ago 1 min read

個人情報フィルタリングはAI開発の周辺機能ではなく本体になった。OpenAIの1.5BオープンウェイトPrivacy Filterは128,000トークンを端末内で処理し、補正版PII-Masking-300kでF1 97.43%を示した。