LLM Feb 27, 2026 1 min read
OpenAIとParadigmは、smart contractの検出・修正・攻撃実行を評価するEVMbenchを発表した。OpenAIによるとGPT-5.3-Codexはexploitモードで72.2%、GPT-5は31.9%だった。
OpenAIとParadigmは、smart contractの検出・修正・攻撃実行を評価するEVMbenchを発表した。OpenAIによるとGPT-5.3-Codexはexploitモードで72.2%、GPT-5は31.9%だった。
OpenAIが、EVMベースのスマートコントラクトにおける高リスク脆弱性の検出・悪用・パッチ能力をAIエージェントで測定する新ベンチマーク「EVMbench」を公開しました。