MockingBird实时语音克隆系统 v1.0
1.0
MockingBird是一个可以克隆您的声音并生成任意语音内容的AI拟声系统。
特性
1、文 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等
2、PyTorch 适用于 pytorch,已在 1.9.0 (最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060
3、Windows + Linux 可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例)
4、Easy & Awesome 仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder
5、Webserver Ready 可伺服你的训练结果,供远程调用
开始
安装要求
按照原始存储库测试您是否已准备好所有环境。 Python 3.7 或更高 需要运行工具箱。
安装 PyTorch。
如果在用 pip 方式安装的时候出现 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2) 这个错误可能是 python 过低,3.9 可以安装成功
安装 ffmpeg。
运行pip install -r requirements.txt 来安装剩余的必要包。
安装 webrtcvad pip install webrtcvad-wheels。