#gpt-5

RSSフィード

LLM X/Twitter Jun 17, 2026 1 min read

OpenAI、130万件の会話でGPT-5系モデルの公開前リスクを予測

安全性評価が、手作りの難問だけでなく実利用に近い発生率予測へ広がっている。OpenAIは約130万件の非識別会話を使い、GPT-5系で中央値1.5倍の予測誤差を示した。

#openai #deployment-simulation #model-safety

AI X/Twitter May 13, 2026 1 min read

OpenAI、サイバー防衛AI「Daybreak」を発表

OpenAIがGPT-5.5とCodexを組み合わせたサイバーセキュリティプラットフォームDaybreakを公開。ソフトウェアの脆弱性を自動検出・パッチ適用し、AnthropicのClaude Mythosとの競争が本格化。

#openai #daybreak #cybersecurity

LLM Hacker News May 8, 2026 1 min read

GPT-5.5の価格改定：実際のコスト影響を分析

OpenAIがGPT-5.5の価格を2倍に引き上げたが、モデルの出力が簡潔になったことで実際のユーザーコスト増加は49〜92%に留まったとOpenRouterが分析した。

#openai #gpt-5 #pricing

LLM May 7, 2026 1 min read

OpenAI、審査済みセキュリティチームにGPT-5.5-Cyberを限定公開 — かつて批判したアプローチを採用

OpenAIは5月7日、「Trusted Access for Cyber」プログラムを通じてGPT-5.5-Cyberの限定公開を開始した。Anthropic Mythosのデビューから約1か月後で、以前は制限公開を批判していたOpenAIが同様の方式を採用した。

#openai #cybersecurity #gpt-5

LLM X/Twitter May 6, 2026 1 min read

OpenAI、GPT-5.5 InstantをChatGPTの新デフォルトモデルに——幻覚エラー52.5%減

OpenAIがGPT-5.5 InstantをChatGPTの新しいデフォルトモデルとしてリリースした。医療・法律・金融など高リスク領域での幻覚エラーを52.5%削減し、より簡潔で自然なトーンの回答を提供する。GmailPlusProユーザーから順次展開される。

#openai #gpt-5 #chatgpt

LLM Reddit May 5, 2026 1 min read

DeepSeek V4 Pro、エージェントベンチマークでGPT-5.2と同等性能――17倍安く10週後に到達

FoodTruck BenchでDeepSeek V4 ProがGPT-5.2と実質同等の性能を記録した。GPT-5.2のテストから約10週後、コストは約17分の1での達成となった。

#deepseek #benchmark #llm

LLM Reddit May 3, 2026 1 min read

ARC-AGI-3最新スコア: GPT-5.5は0.43%、Claude Opus 4.7は0.18%

AGI能力評価ベンチマークARC-AGI-3の最新結果で、GPT-5.5 Highが0.43%、Claude Opus 4.7が0.18%を記録。最先端モデルでも事実上ゼロに近いスコアが続いている。

#arc-agi #benchmark #gpt-5

LLM Reddit May 3, 2026 1 min read

GPT-5.4 Proのエルデシュ問題証明手法、60年来の別の未解決予想にも適用成功

GPT-5.4 ProがエルデシュProblem 1196を解く際に生成した証明手法が、60年来の未解決予想を含む他の数学問題にも適用できることが確認された。

#gpt-5 #mathematics #ai-research

LLM Feb 19, 2026 1 min read

OpenAIがGPT-5を発表、推論・コーディング・信頼性指標を同時提示

OpenAIは2025-08-07にGPT-5を公開し、ChatGPTとAPIの同時展開を発表した。GPT-4o比でhallucinationを45%低減、HealthBench Hard 44.6などの指標を示し、実運用移行の判断材料を強化した。

#openai #gpt-5 #chatgpt

LLM Feb 15, 2026 1 min read

OpenAI、ChatGPTでGPT-4oなど旧モデル提供を終了へ

OpenAIは2026年1月29日の告知で、2月13日からChatGPTでGPT-4oと旧モデルの提供を終了すると発表した。GPT-4oはGPT-5へ、GPT-4.5はGPT-5 thinkingへ、o4-miniはo5-miniへ置き換えられる。

#openai #chatgpt #model-lifecycle

LLM Feb 12, 2026 1 min read

OpenAI、「自らを構築した」AIモデルGPT-5.3-Codexを発表

OpenAIが自身の開発プロセスでバグ修正とデプロイ管理を支援した初のAIモデルGPT-5.3-Codexを発表。セキュリティ上の懸念から厳格な管理下でリリースされます。

#openai #gpt-5 #codex

AI Hacker News Feb 12, 2026 1 min read

GPT-5が連邦判事を上回る法的推論能力を実証

新しい研究で、OpenAIのGPT-5モデルが複雑な法的推論実験において連邦判事を上回る性能を示しました。

#gpt-5 #openai #legal-ai