OpenAI, GPT-5 공개: 추론·코딩·멀티모달 전반 성능 지표 제시
Original: Introducing GPT-5 View original →
출시 핵심
OpenAI는 2025-08-07 자 공식 발표에서 GPT-5를 공개하고, ChatGPT와 API 양쪽에 동시 적용한다고 밝혔다. 발표문에 따르면 GPT-5는 단일 모델이 아니라 라우팅 시스템을 포함한 통합 구조로 설명된다. 쉬운 질의에는 빠르게 응답하고, 어려운 질의에는 더 많은 추론 단계를 할당해 정확도를 높이는 접근이다.
출시 접근성도 함께 제시됐다. OpenAI는 런치 시점에 ChatGPT와 API에서 GPT-5 계열을 제공하고, Team은 즉시, Enterprise와 Edu는 그 다음 주에 확대한다고 명시했다. 무료 사용자도 GPT-5를 사용할 수 있고, Plus/Pro는 더 높은 한도와 추가 기능을 받는 구조다.
공개된 성능 수치
발표 페이지의 수치에서 가장 눈에 띄는 항목은 안정성과 장문 작업 처리다. OpenAI는 GPT-5가 GPT-4o 대비 hallucination을 45% 줄였다고 제시했다. 또한 HealthBench Hard 점수는 16.4에서 44.6으로 상승한 값이 공개됐다.
같은 문서에서 제시된 대표 벤치마크는 MMMU 77.2, GPQA 88.4, AIME'25 87.6, SWE-bench Verified 74.9다. OpenAI는 이 수치를 통해 GPT-5가 범용 질의응답뿐 아니라 코드 수정·검증, 과학 추론 등 고난도 과제에서도 경쟁력 있는 범용 모델임을 강조했다.
제품/개발 생태계 영향
- ChatGPT 측면: 사용자 체감 품질과 안정성 기준을 재설정하는 업데이트
- API 측면:
gpt-5,gpt-5-mini,gpt-5-nano로 워크로드별 비용·지연 최적화 선택지 제공 - 운영 측면: System Card와 Safety Evaluations를 함께 공개해 도입 검토 시 거버넌스 자료를 동반
정리하면 이번 발표의 포인트는 단순 모델 네이밍 업데이트가 아니라, OpenAI가 ChatGPT 사용자 경험과 개발자 배포 경로를 동일한 GPT-5 축으로 맞춘 데 있다. 기업 입장에서는 품질 지표와 배포 옵션이 동시에 공개된 점이 실제 전환 판단에 직접적인 근거가 된다.
Source: OpenAI - Introducing GPT-5
Related Articles
xAI가 노리는 곳은 데모 음성 비서가 아니라 실제 업무용 음성 에이전트다. Grok Voice Think Fast 1.0은 τ-voice Bench 1위를 내세웠고, 25개 이상 언어 지원과 함께 Starlink 운영에서 20% 판매 전환, 70% 지원 해결률을 기록했다고 적었다.
OpenAI가 겨냥한 지점은 채팅이 아니라 장기 작업 자동화다. 공개 수치 기준으로 GPT-5.5는 Terminal-Bench 2.0에서 82.7%를 기록해 GPT-5.4보다 7.6%p 높았고, Codex에서는 더 적은 토큰으로 같은 일을 밀어붙인다고 적었다.
HN은 단순한 신제품 반응이 아니라 ChatGPT Images 2.0을 text, layout, 이상한 제약, 가격, provenance까지 한꺼번에 시험하는 분위기였다.
Comments (0)
No comments yet. Be the first to comment!