AudioGPT 下载 - AudioGPT 源代码下载

下载

AudioGPT：理解和生成语音、音乐、声音和头部说话

我们在此存储库中以开源方式提供我们的实现和预训练模型。

请参考run.md

这里我们列出了AudioGPT此时的能力。更多受支持的模型和任务即将推出。有关提示示例，请参阅资产。

目前并非每个模型都有存储库。

任务	支持的基础模型	地位
文字转语音	FastSpeech、SyntaSpeech、VITS	是（WIP）
风格转移	通用演讲	是的
语音识别	窃窃私语，顺应者	是的
语音增强	ConvTasNet	是（WIP）
语音分离	TF-GridNet	是（WIP）
语音翻译	多解码器	在制品
单耳至双耳	神经扭曲	是的

任务	支持的基础模型	地位
文字唱歌	DiffSinger、VISinger	是（WIP）