GPT-5.5-Cyberが85.6%、OpenAIの防御AIは脆弱性発見から修正工程と統制強化へ移行
Original: OpenAI Daybreak shifts cyber AI from finding bugs to landing fixes View original →
発見から修正レビューまでを同じ流れに
AIセキュリティの競争軸は、脆弱性を見つけられるかだけではなく、検証し、証拠を残し、修正案を作り、人間がレビューできる形に戻せるかへ移っている。OpenAIの6月22日の投稿は、DaybreakをCodex Security、GPT-5.5-Cyber、パートナープログラム、オープンソース支援へ広げる内容だった。
“find, validate, and fix vulnerabilities right inside Codex”
数字はこの方向転換をはっきり示す。リンク先のOpenAI記事では、GPT-5.5-CyberがCyberGymの単一モデル評価で85.6%を記録し、GPT-5.5の81.8%を上回った。ExploitGymでは39.5%対25.95%、SEC-bench Proでは69.8%対63.1%だった。Codex Securityは3万超のコードベースと3,000万超のコミットを走査し、人手で修正済みとされた発見は7万件超、自動的に修正済みと判定された発見は50万件超に達したという。
OpenAIのXアカウントは、同社の製品、研究、政策上の更新を出す公式チャネルだ。今回の投稿は単なるベンチマーク表ではなく、開発現場の作業設計に近い。Codex内で深いスキャンを走らせ、攻撃経路を追い、脅威モデルを作り、検証証拠と修正案を人間のレビューに渡す。大量のアラートではなく、修正へ進める単位に整えることが焦点になっている。
もう一つの軸が、セキュリティ企業向けのCyber Partner Programと、オープンソース向けのPatch the Planetだ。OpenAIは、cURL、Go、Python、Sigstore、pyca/cryptographyなど30超のプロジェクトが初期参加に同意し、Trail of Bits、HackerOne、Calif、研究者、メンテナーが関わると説明している。次に見るべきなのは、実際にマージされたパッチの質、誤検知の削減、そして高能力なサイバーモデルへのアクセス管理の透明性だ。 Source tweet
Related Articles
OpenAIはCodexのcomputer useをWindowsへ広げ、コーディングエージェントが動ける場所を変えた。5月29日の投稿は95万回超表示され、ChatGPTモバイルからWindows上の作業を確認・指示できるという。
OpenAI frontier modelsとCodexがAmazon Bedrockで一般提供になった。120万超の閲覧を集めた投稿は、企業の既存AWS統制内でOpenAIを使う経路を示している。
安全性評価が、手作りの難問だけでなく実利用に近い発生率予測へ広がっている。OpenAIは約130万件の非識別会話を使い、GPT-5系で中央値1.5倍の予測誤差を示した。