OpenAI、GPT-5.4を公開推論強化・native computer use・Codex 1M contextを導入

OpenAIは2026年3月5日、GPT-5.4の提供開始を発表し、ChatGPT、API、Codex全体に段階的に展開するとした。ChatGPTではGPT-5.4 Thinkingとして提供され、APIでは`gpt-5.4`と`gpt-5.4-pro`が使える。OpenAIは今回のreleaseを、GPT-5.3-Codexのfrontier coding capabilityを取り込んだ初のmainline reasoning modelと位置付けている。つまりreasoning、coding、tool useを個別機能としてではなく、一つの汎用agent workflowにまとめていく方向がより明確になったということだ。

公開されたbenchmarkもその方向性を裏付ける。OpenAIによれば、GPT-5.4はGDPvalで83.0%を記録し、GPT-5.2の70.9%を上回った。SWE-Bench Proでは57.7%、OSWorld-Verifiedでは75.0%、BrowseCompでは82.7%とされている。さらにOpenAIはprofessional knowledge workの改善を強調した。内部のinvestment banking spreadsheet benchmarkではGPT-5.4が87.3%を記録し、presentation evalではhuman raterが68%の割合でGPT-5.4の出力をGPT-5.2より好んだという。de-identified user prompt群では、個別の事実主張が誤る可能性がGPT-5.2比で33%低く、回答全体に何らかの誤りを含む確率も18%低いと説明している。

product面での変化はagent builderに直結する。OpenAIはGPT-5.4を、自社初のgeneral-purpose native computer use modelだとしており、実際のinterfaceやsoftware systemをまたぐ作業を前提にしている。また、より大きなtool ecosystemを効率よく扱うためのtool searchも導入した。Codexではexperimental 1M context window supportも提供される。標準の272K contextを超えるrequestは通常の2倍でusage計算されるが、それでも長いtaskを一つのsession内でplanし、実行し、検証したいdeveloperにとっては大きな拡張だ。

安全面と価格も同時に示された。GPT-5.4 Thinking system cardでは、このmodelがHigh capability in Cybersecurityに対するmitigationを適用した初のgeneral-purpose modelだと説明されている。API価格は`gpt-5.4`が入力100万tokenあたり2.50ドル、出力100万tokenあたり15ドル、`gpt-5.4-pro`はそれぞれ30ドルと180ドルだ。ChatGPT Plus、Team、ProのユーザーはすぐにGPT-5.4 Thinkingを利用でき、EnterpriseとEduはadmin設定でearly accessを有効化できる。今回のreleaseは単なるscore向上ではなく、OpenAIがChatGPT、Codex、APIを一つのagent platformとしてさらに強く揃え始めたことを示している。

OpenAI、GPT-5.4を公開推論強化・native computer use・Codex 1M contextを導入

Related Articles

OpenAI、GPT-5.4 ThinkingとGPT-5.4 ProをChatGPT・API・Codexへ展開

OpenAI、GPT-5.4 Thinking の CoT を隠す能力はまだ低いと報告

OpenAI、GPT-5.4をChatGPT・API・Codexへ展開 1Mコンテキストとnative computer useを搭載

Comments (0)

Leave a Comment