OpenAI가 GPT-5.5와 Codex를 기반으로 소프트웨어 취약점을 자동 탐지·패치하는 사이버 보안 플랫폼 Daybreak를 공개했다. Anthropic의 Claude Mythos에 맞서는 사이버 보안 AI 경쟁이 본격화됐다.
#gpt-5
RSS FeedOpenAI가 GPT-5.5의 가격을 2배 인상했지만 모델의 응답 간결성 덕분에 실제 사용자 비용 증가는 49~92% 수준에 그쳤다는 OpenRouter의 분석이 나왔다.
OpenAI가 5월 7일 사이버보안 전문가 대상 특화 모델 GPT-5.5-Cyber의 제한 공개를 시작했다. Anthropic Mythos 접근 제한을 비판했던 OpenAI도 결국 같은 방식을 채택했다.
OpenAI가 GPT-5.5 Instant를 ChatGPT의 새 기본 모델로 출시했다. 의학·법률·금융 등 고위험 영역에서 환각 오류를 52.5% 줄이고 더 간결하면서 개인화된 응답을 제공한다. Gmail·과거 대화 맥락을 활용하는 개인화 기능이 Plus·Pro 사용자부터 순차 적용된다.
에이전트 벤치마크 FoodTruck Bench에서 DeepSeek V4 Pro가 GPT-5.2와 사실상 동등한 성능을 기록했다. GPT-5.2 테스트 대비 10주 만에, 비용은 약 17배 저렴하다.
AGI 수준 평가 벤치마크 ARC-AGI-3에서 GPT-5.5 High가 0.43%, Claude Opus 4.7이 0.18%를 기록했다. 최강 모델들도 이 벤치마크 앞에서는 사실상 제로에 수렴한다.
GPT-5.4 Pro가 에르되시 문제 1196을 풀기 위해 생성한 증명 방법이 60년 된 또 다른 에르되시 추측을 포함한 여러 문제에 성공적으로 적용됐다.
OpenAI는 2025-08-07에 GPT-5를 공개하며 ChatGPT와 API 동시 제공 전략을 발표했다. GPT-4o 대비 환각 45% 감소, HealthBench Hard 44.6 등 핵심 벤치마크 지표를 제시해 제품·개발자 양쪽에서의 전환 신호를 만들었다.
OpenAI는 2026년 1월 29일 공지를 통해 2월 13일부터 ChatGPT에서 GPT-4o와 구형 모델 선택을 종료한다고 밝혔다. GPT-4o는 GPT-5로, GPT-4.5는 GPT-5 thinking으로, o4-mini는 o5-mini로 대체된다.
새로운 연구에서 OpenAI의 GPT-5 모델이 복잡한 법률 추론 실험에서 연방 판사들을 능가하는 성능을 보였습니다.
OpenAI가 GPT-5.2를 발표하며 400K 토큰 컨텍스트 윈도우와 AIME 2025 수학 벤치마크 100% 달성을 선보였다. GPT-5.2 Thinking 버전은 GDPval 벤치마크에서 전문가 대비 70.9% 승률을 기록했다.