Google、イントネーションを変えずに音色を変えるリアルタイム音声変換システムStreamVCを開発
Downcodes のエディターでは、StreamVC について学習します。StreamVC は、言語の内容やリズムに影響を与えることなく、話者の音色をリアルタイムで変更できる革新的なリアルタイム音声変換テクノロジーです。 SoundStream ニューラル オーディオ コーデックに基づいており、モバイル デバイス上で 70.8 ミリ秒の低遅延推論を実現し、白色化された基本周波数情報を導入することでピッチの一貫性を向上させます。 StreamVC は複数のベンチマーク テストで良好なパフォーマンスを示し、
2024-12-08