OpenAIがGPT-5.5とCodexを組み合わせたサイバーセキュリティプラットフォームDaybreakを公開。ソフトウェアの脆弱性を自動検出・パッチ適用し、AnthropicのClaude Mythosとの競争が本格化。
#gpt-5
RSS FeedOpenAIがGPT-5.5の価格を2倍に引き上げたが、モデルの出力が簡潔になったことで実際のユーザーコスト増加は49〜92%に留まったとOpenRouterが分析した。
OpenAIは5月7日、「Trusted Access for Cyber」プログラムを通じてGPT-5.5-Cyberの限定公開を開始した。Anthropic Mythosのデビューから約1か月後で、以前は制限公開を批判していたOpenAIが同様の方式を採用した。
OpenAIがGPT-5.5 InstantをChatGPTの新しいデフォルトモデルとしてリリースした。医療・法律・金融など高リスク領域での幻覚エラーを52.5%削減し、より簡潔で自然なトーンの回答を提供する。GmailPlusProユーザーから順次展開される。
FoodTruck BenchでDeepSeek V4 ProがGPT-5.2と実質同等の性能を記録した。GPT-5.2のテストから約10週後、コストは約17分の1での達成となった。
AGI能力評価ベンチマークARC-AGI-3の最新結果で、GPT-5.5 Highが0.43%、Claude Opus 4.7が0.18%を記録。最先端モデルでも事実上ゼロに近いスコアが続いている。
GPT-5.4 ProがエルデシュProblem 1196を解く際に生成した証明手法が、60年来の未解決予想を含む他の数学問題にも適用できることが確認された。
OpenAIは2025-08-07にGPT-5を公開し、ChatGPTとAPIの同時展開を発表した。GPT-4o比でhallucinationを45%低減、HealthBench Hard 44.6などの指標を示し、実運用移行の判断材料を強化した。
OpenAIは2026年1月29日の告知で、2月13日からChatGPTでGPT-4oと旧モデルの提供を終了すると発表した。GPT-4oはGPT-5へ、GPT-4.5はGPT-5 thinkingへ、o4-miniはo5-miniへ置き換えられる。
OpenAIが自身の開発プロセスでバグ修正とデプロイ管理を支援した初のAIモデルGPT-5.3-Codexを発表。セキュリティ上の懸念から厳格な管理下でリリースされます。
新しい研究で、OpenAIのGPT-5モデルが複雑な法的推論実験において連邦判事を上回る性能を示しました。