GPT-5.5-Cyberが85.6%、OpenAIの防御AIは脆弱性発見から修正工程と統制強化へ移行

発見から修正レビューまでを同じ流れに

AIセキュリティの競争軸は、脆弱性を見つけられるかだけではなく、検証し、証拠を残し、修正案を作り、人間がレビューできる形に戻せるかへ移っている。OpenAIの6月22日の投稿は、DaybreakをCodex Security、GPT-5.5-Cyber、パートナープログラム、オープンソース支援へ広げる内容だった。

“find, validate, and fix vulnerabilities right inside Codex”

数字はこの方向転換をはっきり示す。リンク先のOpenAI記事では、GPT-5.5-CyberがCyberGymの単一モデル評価で85.6%を記録し、GPT-5.5の81.8%を上回った。ExploitGymでは39.5%対25.95%、SEC-bench Proでは69.8%対63.1%だった。Codex Securityは3万超のコードベースと3,000万超のコミットを走査し、人手で修正済みとされた発見は7万件超、自動的に修正済みと判定された発見は50万件超に達したという。

OpenAIのXアカウントは、同社の製品、研究、政策上の更新を出す公式チャネルだ。今回の投稿は単なるベンチマーク表ではなく、開発現場の作業設計に近い。Codex内で深いスキャンを走らせ、攻撃経路を追い、脅威モデルを作り、検証証拠と修正案を人間のレビューに渡す。大量のアラートではなく、修正へ進める単位に整えることが焦点になっている。

もう一つの軸が、セキュリティ企業向けのCyber Partner Programと、オープンソース向けのPatch the Planetだ。OpenAIは、cURL、Go、Python、Sigstore、pyca/cryptographyなど30超のプロジェクトが初期参加に同意し、Trail of Bits、HackerOne、Calif、研究者、メンテナーが関わると説明している。次に見るべきなのは、実際にマージされたパッチの質、誤検知の削減、そして高能力なサイバーモデルへのアクセス管理の透明性だ。 Source tweet

GPT-5.5-Cyberが85.6%、OpenAIの防御AIは脆弱性発見から修正工程と統制強化へ移行

発見から修正レビューまでを同じ流れに

Related Articles

CodexがWindows PCを直接操作し、ChatGPTモバイルから開発作業を続ける技術的意味

OpenAIモデルとCodex、AWS Bedrock一般提供で企業AI導入の新しい経路を拡大へ進む

OpenAI、130万件の会話でGPT-5系モデルの公開前リスクを予測