OpenAIはChain-of-Thought controllabilityに関する新しいevaluation suiteとresearch paperを公開した。GPT-5.4 Thinkingはreasoningを隠す能力が低く、CoT monitoringが引き続き有効な safety signalになり得ると同社は説明している。
#openai
OpenAIはGPT-5.4 ThinkingとProをChatGPT、API、Codexに段階的に展開すると述べた。GPT-5.4はcoding、computer use、tool search、1M-token contextを備えた professional work向け frontier modelとして位置付けられている。
OpenAIとAmazonは2026年2月27日、multi-year strategic partnershipを発表した。発表にはAmazon Bedrock向けStateful Runtime Environmentの共同開発、OpenAI FrontierのAWSによるexclusive third-party distribution、約2 gigawattsのTrainium capacity、そしてAmazonによる$50 billion投資が含まれる。
OpenAI Developersは2026年3月11日、Responses APIが長時間のagent workflowを処理するために使うhosted computer environmentの設計を説明した。中心となる要素はshell execution、hosted container、制御されたnetwork access、reusable skills、native compactionだ。
OpenAIはCodex SecurityをCodex web経由でresearch previewとして展開すると発表した。project contextを踏まえて、より高信頼な脆弱性検出とpatch提案を行うapplication security agentという位置づけだ。
OpenAIはPromptfooを買収し、そのsecurity/evaluation機能をOpenAI Frontierに統合すると発表した。Promptfooは現行ライセンスのままopen sourceで継続され、既存顧客へのサポートも続くという。
OpenAIはXで Codex Security の research preview 開始を発表した。OpenAIはこれを、複雑な脆弱性をより少ない noise で検出・検証・修正できる application security agent と位置づけている。
OpenAIは3月9日にXで、AI security platform の Promptfoo を買収する計画を明らかにした。Promptfoo は open source を維持し、今回の取引は OpenAI Frontier の agentic testing・evaluation stack を強化する位置づけだ。
OpenAIはFirst Proofの10問すべてに対する証明試行を公開し、専門家のフィードバックに基づいて少なくとも5件が正しい可能性が高いと述べた。通常のbenchmarkを超える長時間 reasoning評価として位置づけている。
OpenAIは2026年2月27日、$110Bの新規投資とAmazon・NVIDIAとの提携拡大を発表した。背景には900Mの週間ChatGPT利用者、9 millionの有料法人利用者、そして急増するCodex需要があると説明している。
OpenAIはGPT-5.4 ThinkingをChatGPTに、GPT-5.4をAPIとCodexに、GPT-5.4 ProをChatGPTとAPIに投入した。reasoning、coding、native computer useを最大1M-token contextと合わせて1つのprofessional-work modelにまとめた点が重要だ。
OpenAI DevelopersがGPT-5.4 API向けのプロンプトガイドを更新した。tool use、structured outputs、verification loops、長時間ワークフローの設計を整理し、production-grade agentsの安定運用を狙う内容だ。