#voice-cloning

RSSフィード

AI X/Twitter May 2, 2026 1 min read

xAI、2分以内で声のクローンを作れるVoice Cloning APIをリリース

xAIが自社APIを通じてVoice Cloningを正式リリース。短い音声録音から2分以内にカスタムボイスを作成できるほか、28言語・80種以上の事前構築済み音声ライブラリからも選択できる。

#xai #grok #voice-cloning

LLM Reddit Apr 24, 2026 1 min read

Qwen3 TTSでLocalLLaMAが沸いた理由ローカル実時間と口パク同期まで届いた

LocalLLaMAが反応したのは単なる音声デモではなかった。Qwen3-TTSをローカル実時間で動かし、llama.cppと単語単位アラインメントまで組み合わせた実装記録だった。

#qwen #tts #llama.cpp

LLM Reddit Mar 29, 2026 1 min read

LocalLLaMAが注目したVoxtral音声クローニング復元、Mistral TTSの空白を埋める試み

2026年3月にr/LocalLLaMAで123 pointsと25 commentsを集めた `voxtral-voice-clone` は、MistralのVoxtral-4B-TTS-2603から欠けていたcodec encoderを学習し、`ref_audio` を使う zero-shot voice cloning を復元しようとするプロジェクトだ。

#tts #voice-cloning #mistral

LLM Reddit Feb 23, 2026 1 min read

Qwen3の隠れた機能: 数学的操作で声を変えるVoice Embeddings

Qwen3のTTSモデルは声を1024次元ベクトルにエンコードし、性別変換・音高調整・感情空間生成などの数学的な音声操作を可能にします。軽量なスタンドアロンエンコーダーとしてHuggingFaceで公開されています。

#qwen3 #tts #voice-embeddings

#voice-cloning

xAI、2分以内で声のクローンを作れるVoice Cloning APIをリリース

Qwen3 TTSでLocalLLaMAが沸いた理由 ローカル実時間と口パク同期まで届いた

LocalLLaMAが注目したVoxtral音声クローニング復元、Mistral TTSの空白を埋める試み

Qwen3の隠れた機能: 数学的操作で声を変えるVoice Embeddings

Qwen3 TTSでLocalLLaMAが沸いた理由ローカル実時間と口パク同期まで届いた