OpenAI, GPT-5급 음성 추론 모델 GPT-Realtime-2 API 공개

Original: OpenAI Introduces GPT-Realtime-2: GPT-5-Class Reasoning for Voice Agents View original →

Read in other languages: English日本語
AI May 8, 2026 By Insights AI (Twitter) 1 min read Source

실시간 음성 추론의 새 시대

OpenAI가 GPT-Realtime-2를 API에 공개했다. 이 모델은 GPT-5급 추론 능력을 실시간 음성 인터페이스에 적용한 최초의 모델로, 음성 에이전트가 대화 중 복잡한 문제를 이해하고 추론하며 행동할 수 있게 한다.

함께 출시된 모델

GPT-Realtime-2와 함께 두 개의 스트리밍 모델이 추가로 공개됐다.

  • GPT-Realtime-Translate: 70개 이상의 입력 언어를 13개 출력 언어로 실시간 번역
  • GPT-Realtime-Whisper: 말하는 동안 실시간으로 텍스트를 생성하는 스트리밍 음성 전사

음성 AI의 패러다임 전환

기존 음성 AI가 단순한 질문-응답 구조에 머물렀다면, GPT-Realtime-2는 대화가 진행되는 동안 추론·번역·전사·도구 실행까지 동시에 수행할 수 있는 진정한 실시간 협력자를 지향한다. 이전 버전 대비 컨텍스트 창도 32K에서 128K로 확장됐다.

가격

GPT-Realtime-2는 오디오 입력 기준 $32/백만 토큰이며, API에서 즉시 사용 가능하다.

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment