OpenAI, GPT-5 수준 추론 갖춘 실시간 음성 API 3종 정식 출시

Read in other languages: English日本語
LLM May 11, 2026 By Insights AI 1 min read Source

OpenAI가 5월 7일 세 가지 실시간 음성 모델을 Realtime API를 통해 정식 제공하기 시작했다. GPT-Realtime-2, GPT-Realtime-Translate, GPT-Realtime-Whisper가 그 주인공이다. Realtime API는 이번을 기점으로 베타를 종료하고 일반 제공(GA)으로 전환됐다.

GPT-Realtime-2: GPT-5 수준 음성 에이전트

GPT-Realtime-2는 GPT-5급 추론 능력을 갖춘 음성 에이전트 모델이다. 컨텍스트 윈도우가 3만 2,000토큰에서 12만 8,000토큰으로 4배 확장됐다. 중간에 말이 끊겨도 자연스럽게 이어가며 도구 호출, 장시간 대화 유지가 가능하다.

GPT-Realtime-Translate: 70개 언어 즉석 번역

70개 이상 언어 입력을 13개 출력 언어로 스트리밍 번역한다. 분당 0.034달러에 제공된다. 다국어 고객 지원이나 실시간 통역 서비스에 즉시 적용할 수 있는 API다.

GPT-Realtime-Whisper: 실시간 음성 전사

말하는 즉시 스트리밍 방식으로 텍스트를 변환한다. 분당 0.017달러로 세 모델 중 가장 저렴하다. 자막 생성이나 회의록 작성 자동화 용도에 적합하다.

자세한 내용은 OpenAI 공식 발표에서 확인하라.

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment