#gpt-5

LLM X/Twitter Jun 17, 2026 1 min read

1.3M 대화로 GPT-5 계열 출시 전 위험률을 예측한 OpenAI 실험

모델 안전성 검토가 손으로 만든 테스트를 넘어 출시 전 위험률 예측으로 이동하고 있다. OpenAI는 약 130만 건의 비식별 대화를 활용했고, GPT-5 계열에서 중앙값 1.5배 오차를 보고했다.

#openai #deployment-simulation #model-safety

AI X/Twitter May 13, 2026 1 min read

OpenAI, 사이버 방어 AI 플랫폼 Daybreak 출시

OpenAI가 GPT-5.5와 Codex를 기반으로 소프트웨어 취약점을 자동 탐지·패치하는 사이버 보안 플랫폼 Daybreak를 공개했다. Anthropic의 Claude Mythos에 맞서는 사이버 보안 AI 경쟁이 본격화됐다.

#openai #daybreak #cybersecurity

LLM Hacker News May 8, 2026 1 min read

GPT-5.5 가격 인상, 실제 비용 영향은 얼마나?

OpenAI가 GPT-5.5의 가격을 2배 인상했지만 모델의 응답 간결성 덕분에 실제 사용자 비용 증가는 49~92% 수준에 그쳤다는 OpenRouter의 분석이 나왔다.

#openai #gpt-5 #pricing

LLM May 7, 2026 1 min read

OpenAI, 검증된 사이버보안 팀에 GPT-5.5-Cyber 제한 배포 — Mythos 논란의 메아리

OpenAI가 5월 7일 사이버보안 전문가 대상 특화 모델 GPT-5.5-Cyber의 제한 공개를 시작했다. Anthropic Mythos 접근 제한을 비판했던 OpenAI도 결국 같은 방식을 채택했다.

#openai #cybersecurity #gpt-5

LLM X/Twitter May 6, 2026 1 min read

ChatGPT 기본 모델, GPT-5.5 Instant로 교체—환각 오류 52.5% 감소, 더 간결한 응답

OpenAI가 GPT-5.5 Instant를 ChatGPT의 새 기본 모델로 출시했다. 의학·법률·금융 등 고위험 영역에서 환각 오류를 52.5% 줄이고 더 간결하면서 개인화된 응답을 제공한다. Gmail·과거 대화 맥락을 활용하는 개인화 기능이 Plus·Pro 사용자부터 순차 적용된다.

#openai #gpt-5 #chatgpt

LLM Reddit May 5, 2026 1 min read

DeepSeek V4 Pro, 프론티어 대비 17배 저렴하면서 GPT-5.2와 성능 동률

에이전트 벤치마크 FoodTruck Bench에서 DeepSeek V4 Pro가 GPT-5.2와 사실상 동등한 성능을 기록했다. GPT-5.2 테스트 대비 10주 만에, 비용은 약 17배 저렴하다.

#deepseek #benchmark #llm

LLM Reddit May 3, 2026 1 min read

ARC-AGI-3 최신 결과: GPT-5.5는 0.43%, Claude Opus 4.7은 0.18%

AGI 수준 평가 벤치마크 ARC-AGI-3에서 GPT-5.5 High가 0.43%, Claude Opus 4.7이 0.18%를 기록했다. 최강 모델들도 이 벤치마크 앞에서는 사실상 제로에 수렴한다.

#arc-agi #benchmark #gpt-5

LLM Reddit May 3, 2026 1 min read

GPT-5.4 Pro의 에르되시 문제 풀이법, 60년 묵은 또 다른 난제에도 통했다

GPT-5.4 Pro가 에르되시 문제 1196을 풀기 위해 생성한 증명 방법이 60년 된 또 다른 에르되시 추측을 포함한 여러 문제에 성공적으로 적용됐다.

#gpt-5 #mathematics #ai-research

LLM Feb 19, 2026 1 min read

OpenAI, GPT-5 공개: 추론·코딩·멀티모달 전반 성능 지표 제시

OpenAI는 2025-08-07에 GPT-5를 공개하며 ChatGPT와 API 동시 제공 전략을 발표했다. GPT-4o 대비 환각 45% 감소, HealthBench Hard 44.6 등 핵심 벤치마크 지표를 제시해 제품·개발자 양쪽에서의 전환 신호를 만들었다.

#openai #gpt-5 #chatgpt

LLM Feb 15, 2026 1 min read

OpenAI, ChatGPT에서 GPT-4o 및 구형 모델 단계적 종료

OpenAI는 2026년 1월 29일 공지를 통해 2월 13일부터 ChatGPT에서 GPT-4o와 구형 모델 선택을 종료한다고 밝혔다. GPT-4o는 GPT-5로, GPT-4.5는 GPT-5 thinking으로, o4-mini는 o5-mini로 대체된다.

#openai #chatgpt #model-lifecycle

AI Hacker News Feb 12, 2026 1 min read

GPT-5가 연방 판사를 능가하는 법률 추론 능력 입증

새로운 연구에서 OpenAI의 GPT-5 모델이 복잡한 법률 추론 실험에서 연방 판사들을 능가하는 성능을 보였습니다.

#gpt-5 #openai #legal-ai

LLM Feb 11, 2026 1 min read

OpenAI, GPT-5.2 공개... 전문 지식 작업에서 인간 전문가 수준 달성

OpenAI가 GPT-5.2를 발표하며 400K 토큰 컨텍스트 윈도우와 AIME 2025 수학 벤치마크 100% 달성을 선보였다. GPT-5.2 Thinking 버전은 GDPval 벤치마크에서 전문가 대비 70.9% 승률을 기록했다.

#openai #gpt-5 #benchmark