请注意,我不打算积极致力于此项目的改进/增强,这主要是为了在原始 git.ecker 出现故障或需要进行必要的包更改的情况下使存储库保持在工作状态。
话虽如此,与原始存储库相比,添加了一些增强功能:
✔️ 可以用其他语言进行培训
✔️ 添加了 Hifigan,可以以牺牲质量为代价实现更快的推理。
✔️ 添加 Whisper-v3 作为 Whisperx 的可选选项
✔️ 使用 RVC 进行输出转换
这是最初位于此处的存储库的分支:https://git.ecker.tech/mrq/ai-voice-cloning。所有将 DLAS 训练和 Tortoise 推理相结合的工作都属于 mrq,他是原始 ai-voice-cloning 存储库的作者。
此存储库适用于具有 NVIDIA GPU 的 Windows和运行具有 NVIDIA GPU 的 Docker 的 Linux 。
start.bat
如果您手动安装,您将需要:
git clone https://github.com/JarodMica/ai-voice-cloning.git
setup-cuda.bat
文件,它将开始运行所需的所有 python 包start.bat
,这将开始下载您需要的大部分模型。models
文件夹中。setup-whipserx.bat
安装 Whipserx 进行训练确保安装了最新的 nvidia 驱动程序: sudo ubuntu-drivers install
按照您喜欢的方式安装 Docker。一种方法是遵循此处的官方文档。
如果在启动语音克隆 docker 时出现错误消息,提示无法使用 GPU,则可能需要安装 Nvidia Docker Container Toolkit。
使用“apt”方法安装
运行docker配置命令
sudo nvidia-ctk runtime configure --runtime=docker
重启docker
确保您的 Nvidia 驱动程序是最新的:https://www.nvidia.com/download/index.aspx
wsl --install
并重新启动在 PowerShell 中安装 WSL2ubuntu
。现在应该将您加载到 wsl2sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4
ubuntu
,然后按照以下步骤操作git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
./setup-docker.sh
构建镜像./start-docker.sh
启动容器http://localhost:7860
或使用http://<ip>:7860
远程访问如果无法访问远程服务器,请查看此线程
您可能还需要将本地文件夹重新映射到 Docker 文件夹。为此,您必须打开“start-docker.sh”脚本,并更新一些行。例如,如果您想轻松找到生成的音频,请在根目录中创建一个“results”文件夹,然后在“start-docker.sh”中添加以下行:
-v "your/custom/path:/home/user/ai-voice-cloning/results"
查看 YouTube 视频:
首先观看:https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf
第二次观看(RVC 更新):https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s
如果您过去使用过此存储库,一切都与以前几乎相同,但是,有一个新选项可以使用rvc
转换文本输出。在使用它之前,您需要从 RVC 或在线获取经过训练的RVC .pth 文件,然后需要将其放置在models/rvc_models/
中。 .index 和 .pth 文件都可以放置在此处,它们将在各自的下拉菜单中正确显示。
启用 rvc:
Show Experimental Settings
以显示更多选项Run the outputter audio through RVC
。您现在可以访问可在 RVC 中针对您正在使用的 RVC 语音模型进行调整的参数。 以下是如何更新软件包以获取最新更新
注意:如果有重大功能更改,请检查最新版本以查看
update_package.bat
是否有效。如果没有,您将需要从 Hugging Face 重新下载并重新解压软件包。
update_package.bat
文件您应该能够导航到该文件夹,然后拉取存储库来更新它。
cd ai-voice-cloning
git pull
如果添加了大型功能,您可能需要删除 venv 并重新运行 setup-cuda 脚本以确保不存在软件包问题
您应该能够导航到该文件夹,然后拉取存储库来更新它,然后重建您的 Docker 映像。
cd ai-voice-cloning
git pull
./setup-docker.sh
终端是你的朋友。当您尝试运行时,任何错误或问题都会在终端中弹出,然后您可以从那里开始调试。
.venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
如果您遇到任何问题,请在问题选项卡上打开新问题。
setup-cuda.bat
应该包含安装软件包所需的一切。所有不同的需求文件使得脚本中变得非常混乱,但是每个存储库都安装了它们的需求,最后,需要根目录中的requirements.txt
将版本更改回该存储库的兼容版本。