AI X/Twitter May 2, 2026 1 min read
xAIが自社APIを通じてVoice Cloningを正式リリース。短い音声録音から2分以内にカスタムボイスを作成できるほか、28言語・80種以上の事前構築済み音声ライブラリからも選択できる。
xAIが自社APIを通じてVoice Cloningを正式リリース。短い音声録音から2分以内にカスタムボイスを作成できるほか、28言語・80種以上の事前構築済み音声ライブラリからも選択できる。
2026年3月19日にHacker Newsへ投稿されたKitten TTSスレッドは、クロール時点で512ポイントと172件のコメントを集めた。KittenMLは15M、40M、80MのONNX音声合成モデル、8つのEnglish voice、24kHz出力、CPU推論を前面に出している。
xAIは2026年3月16日、GrokのText-to-Speech APIが利用可能になったと発表した。公式voiceドキュメントでは、このbeta APIが5つのvoice、inline speech tags、telephony向けcodec、low-latencyなWebSocket streamingを備えると説明している。