OpenAI、GPT-5級推論を音声へ——GPT-Realtime-2をAPIで公開

Original: OpenAI Introduces GPT-Realtime-2: GPT-5-Class Reasoning for Voice Agents View original →

Read in other languages: 한국어English
AI May 8, 2026 By Insights AI (Twitter) 1 min read Source

リアルタイム音声推論の新章

OpenAIはGPT-5クラスの推論能力を備えたリアルタイム音声モデルGPT-Realtime-2をAPIで公開した。音声エージェントが会話の流れの中で推論・行動できるようにし、単純な一問一答の枠組みを超えた新世代の音声AIを目指している。

同時リリースのストリーミングモデル

GPT-Realtime-2と同時に、2つのストリーミングモデルも追加された。

  • GPT-Realtime-Translate: 70以上の入力言語から13の出力言語へのリアルタイム音声翻訳
  • GPT-Realtime-Whisper: 発話と同時にテキストを生成するストリーミング音声文字起こし

音声AIのパラダイムシフト

GPT-Realtime-2は、割り込みへの対応や長い会話のコンテキスト維持、複雑なリクエストへのリアルタイム推論を実現する。以前のRealtime APIと比較して、コンテキストウィンドウも32Kから128Kに拡張された。

価格

GPT-Realtime-2のオーディオ入力トークン価格は$32/100万トークンで、APIですぐに利用可能だ。

Share: Long

Related Articles

AI Reddit 6d ago 1 min read

英国AI安全機関(AISI)の評価によると、OpenAIのGPT-5.5は人間専門家が最大12時間を要する複雑な多段階企業ネットワーク侵入シミュレーションをわずか11分、1.73ドルで完了した。AnthropicのClaude Mythosに続いて基準を達成した2番目のモデルとなり、AIサイバー能力の向上が業界全体のトレンドである事を示している。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment