OpenAI, GPT-5급 추론의 실시간 음성 API 모델 3종 공개
OpenAI가 실시간 음성 API에 GPT-5급 추론 능력을 갖춘 3개 신규 모델을 출시하며 Realtime API를 베타에서 정식 서비스(GA)로 전환했다.
3개 신규 모델
- GPT-Realtime-2: GPT-5 수준의 추론을 갖춘 첫 음성 모델로, 스트리밍 오디오를 처리하며 도구 병렬 호출·인터럽션 처리를 실시간으로 수행한다. 입력 토큰 100만 개당 $32, 출력 100만 개당 $64.
- GPT-Realtime-Translate: 70개 이상 입력 언어를 13개 출력 언어로 화자의 발화 속도에 맞춰 동시통역한다. 분당 $0.034.
- GPT-Realtime-Whisper: 화자가 말하는 동안 실시간으로 텍스트로 변환하는 스트리밍 전사 모델. 분당 $0.017.
Realtime API 정식 서비스 전환
이번 출시로 Realtime API는 베타를 종료하고 프로덕션 환경에 적합한 정식 서비스로 전환됐다. 개발자는 별도의 전사·합성 단계 없이 오디오 스트림을 직접 처리하는 음성 앱을 구축할 수 있다. 자세한 내용은 OpenAI 블로그에서 확인 가능하다.
Related Articles
LLM 3d ago 1 min read
OpenAI가 2026년 5월 7일 API를 통해 실시간 음성 AI 3종을 공개했다. GPT-5급 추론을 갖춘 GPT-Realtime-2, 70개 언어 실시간 번역, 스트리밍 전사 모델이 각각 출시됐다.
LLM 5d ago 1 min read
OpenAI가 5월 7일 GPT-Realtime-2·Translate·Whisper 세 모델을 Realtime API를 통해 정식 제공하기 시작했다. 70개 언어 즉석 번역과 스트리밍 음성 전사, 12만 8천 토큰 컨텍스트 창을 지원한다.
LLM May 9, 2026 1 min read
OpenAI가 5월 5일 GPT-5.5 Instant를 ChatGPT 무료 포함 전 사용자의 기본 모델로 교체했다. 이전 대화·첨부파일·Gmail 기록을 바탕으로 더 개인화된 답변을 제공하며, API에서는 chat-latest 엔드포인트로 접근할 수 있다.
Comments (0)
No comments yet. Be the first to comment!