OuteTTS-0.1-350M: ゼロサンプル音声クローンによる新しいテキスト音声合成手法
Oute AI は、軽量のテキスト音声合成方式 OuteTTS-0.1-350M をリリースしました。このモデルは、LLaMa アーキテクチャに基づいており、WavTokenizer を使用してオーディオ トークンを直接生成するため、効率的で優れたパフォーマンスを備えています。 Downcodes の編集者は、わずか数秒のオーディオで新しいサウンドをコピーできるゼロサンプル音声クローン機能があり、llama.cpp と互換性があるため、リアルタイム アプリケーションに適していることを発見しました。 Out
2024-11-29