OpenAIがGPT-5.4を公開、ChatGPT/API/CodexでTool use性能を強化

Original: GPT-5.4 View original →

Read in other languages: 한국어English
LLM Mar 6, 2026 By Insights AI (HN) 1 min read 2 views Source

発表の要点

OpenAIは2026年3月5日付の Introducing GPT-5.4 で、GPT-5.4をChatGPT(GPT-5.4 Thinking)、API、Codexへ同時展開した。加えて、より高難度タスク向けにGPT-5.4 Proも公開した。今回の軸は、reasoning、coding、tool calling、長時間実行を1つのモデル系列で実運用レベルに引き上げることにある。

Hacker Newsの投稿はクロール時点で816ポイント、658コメントに達し、開発者コミュニティの関心が高いことを示した。議論の中心は「ベンチマークの絶対値」よりも「実際の業務フローをどれだけ安定して完了できるか」に移っている。

公開された主要指標

OpenAI公表値では、GPT-5.4はGPT-5.2比でGDPval 83.0%(70.9%)、SWE-Bench Pro 57.7%(55.6%)、OSWorld-Verified 75.0%(47.3%)、Toolathlon 54.6%(46.3%)、BrowseComp 82.7%(65.8%)を示した。GPT-5.4 ProはBrowseComp 89.3%とされる。さらに、事実誤り報告プロンプト群では、個別claimのfalse率を33%、応答全体の誤り含有率を18%下げたと説明している。

これらはベンダー自己評価だが、OpenAIの開発優先順位を読む材料になる。重点は、知識業務の成果物品質、agent動作の一貫性、web検索を含む統合回答の精度だ。

Computer useとコスト構造

技術面で重要なのは、general-purposeモデルでnative computer-useを前面化した点である。OpenAIはCodex/APIで最大1M-token contextを扱えるとし、tool searchで必要時にtool定義を取得する方式を導入した。公開例では、MCP Atlasタスクで同精度のままtoken使用量を47%削減できたとしている。

価格はGPT-5.4が入力$2.50/M tokens、cached input $0.25/M、出力$15/M。GPT-5.4 Proは入力$30/M、出力$180/Mと案内された。実運用では単価比較だけでなく、token消費削減と再試行削減が総コストにどう効くかが評価軸になる。

出典: OpenAI release, Hacker News thread.

Share:

Related Articles

LLM sources.twitter 5d ago 1 min read

GitHubは2026年3月5日、GPT-5.4がGitHub Copilotで一般提供となり、順次展開中だと発表した。初期テストでは成功率の向上に加え、複雑でツール依存の作業における論理推論と実行力の改善を確認したとしている。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.