OpenAI、GPT-5.4を公開 推論強化・native computer use・Codex 1M contextを導入
Original: Introducing GPT-5.4 View original →
OpenAIは2026年3月5日、GPT-5.4の提供開始を発表し、ChatGPT、API、Codex全体に段階的に展開するとした。ChatGPTではGPT-5.4 Thinkingとして提供され、APIでは`gpt-5.4`と`gpt-5.4-pro`が使える。OpenAIは今回のreleaseを、GPT-5.3-Codexのfrontier coding capabilityを取り込んだ初のmainline reasoning modelと位置付けている。つまりreasoning、coding、tool useを個別機能としてではなく、一つの汎用agent workflowにまとめていく方向がより明確になったということだ。
公開されたbenchmarkもその方向性を裏付ける。OpenAIによれば、GPT-5.4はGDPvalで83.0%を記録し、GPT-5.2の70.9%を上回った。SWE-Bench Proでは57.7%、OSWorld-Verifiedでは75.0%、BrowseCompでは82.7%とされている。さらにOpenAIはprofessional knowledge workの改善を強調した。内部のinvestment banking spreadsheet benchmarkではGPT-5.4が87.3%を記録し、presentation evalではhuman raterが68%の割合でGPT-5.4の出力をGPT-5.2より好んだという。de-identified user prompt群では、個別の事実主張が誤る可能性がGPT-5.2比で33%低く、回答全体に何らかの誤りを含む確率も18%低いと説明している。
product面での変化はagent builderに直結する。OpenAIはGPT-5.4を、自社初のgeneral-purpose native computer use modelだとしており、実際のinterfaceやsoftware systemをまたぐ作業を前提にしている。また、より大きなtool ecosystemを効率よく扱うためのtool searchも導入した。Codexではexperimental 1M context window supportも提供される。標準の272K contextを超えるrequestは通常の2倍でusage計算されるが、それでも長いtaskを一つのsession内でplanし、実行し、検証したいdeveloperにとっては大きな拡張だ。
安全面と価格も同時に示された。GPT-5.4 Thinking system cardでは、このmodelがHigh capability in Cybersecurityに対するmitigationを適用した初のgeneral-purpose modelだと説明されている。API価格は`gpt-5.4`が入力100万tokenあたり2.50ドル、出力100万tokenあたり15ドル、`gpt-5.4-pro`はそれぞれ30ドルと180ドルだ。ChatGPT Plus、Team、ProのユーザーはすぐにGPT-5.4 Thinkingを利用でき、EnterpriseとEduはadmin設定でearly accessを有効化できる。今回のreleaseは単なるscore向上ではなく、OpenAIがChatGPT、Codex、APIを一つのagent platformとしてさらに強く揃え始めたことを示している。
Related Articles
OpenAIはGPT-5.4 ThinkingをChatGPTに、GPT-5.4をAPIとCodexに、GPT-5.4 ProをChatGPTとAPIに投入した。reasoning、coding、native computer useを最大1M-token contextと合わせて1つのprofessional-work modelにまとめた点が重要だ。
OpenAIは2026年3月5日のX投稿で、GPT-5.4 Thinking の Chain-of-Thought controllability が低いと説明した。新しい open-source 評価と論文は、CoT monitoring が当面有効な safety signal であり続ける可能性を示している。
OpenAIは2026-03-05のX投稿で、GPT-5.4 ThinkingとGPT-5.4 Proの展開開始を発表した。公式記事では、1M-token context、native computer use、tool search、そしてspreadsheet・document・presentation業務の強化を備えたprofessional-work向けモデルとして位置づけている。
Comments (0)
No comments yet. Be the first to comment!