OpenAI, GPT-5급 음성 추론 모델 GPT-Realtime-2 API 공개
Original: OpenAI Introduces GPT-Realtime-2: GPT-5-Class Reasoning for Voice Agents View original →
실시간 음성 추론의 새 시대
OpenAI가 GPT-Realtime-2를 API에 공개했다. 이 모델은 GPT-5급 추론 능력을 실시간 음성 인터페이스에 적용한 최초의 모델로, 음성 에이전트가 대화 중 복잡한 문제를 이해하고 추론하며 행동할 수 있게 한다.
함께 출시된 모델
GPT-Realtime-2와 함께 두 개의 스트리밍 모델이 추가로 공개됐다.
- GPT-Realtime-Translate: 70개 이상의 입력 언어를 13개 출력 언어로 실시간 번역
- GPT-Realtime-Whisper: 말하는 동안 실시간으로 텍스트를 생성하는 스트리밍 음성 전사
음성 AI의 패러다임 전환
기존 음성 AI가 단순한 질문-응답 구조에 머물렀다면, GPT-Realtime-2는 대화가 진행되는 동안 추론·번역·전사·도구 실행까지 동시에 수행할 수 있는 진정한 실시간 협력자를 지향한다. 이전 버전 대비 컨텍스트 창도 32K에서 128K로 확장됐다.
가격
GPT-Realtime-2는 오디오 입력 기준 $32/백만 토큰이며, API에서 즉시 사용 가능하다.
Related Articles
왜 중요한가: xAI가 Grok Voice stack을 standalone STT/TTS API로 내며 batch $0.10/hour, streaming $0.20/hour 가격을 제시했다. 25+ languages, diarization, word-level timestamps는 call center와 meeting transcription 시장을 직접 겨냥한다.
미 국방부가 OpenAI·구글·마이크로소프트 등 8개사와 최고 기밀 분류 네트워크에서의 AI 배포 협정을 체결했다. 앤트로픽은 군사적 활용 제한 조항을 둘러싼 분쟁으로 유일하게 제외됐다.
2019년부터 이어온 Microsoft와 OpenAI의 Azure 독점 계약이 해제됐다. OpenAI는 이제 AWS·Google Cloud에서도 제품을 제공할 수 있으며, 양사는 수익 공유 구조도 전면 재편했다.
Comments (0)
No comments yet. Be the first to comment!