請注意,我不打算積極致力於此專案的改進/增強,這主要是為了在原始 git.ecker 出現故障或需要進行必要的套件變更的情況下將儲存庫保持在工作狀態。
話雖如此,與原始儲存庫相比,添加了一些增強功能:
✔️ 可以用其他語言進行培訓
✔️ 添加了 Hifigan,可以以犧牲品質為代價實現更快的推理。
✔️ 新增 Whisper-v3 作為 Whisperx 的可選選項
✔️ 使用 RVC 進行輸出轉換
這是最初位於此處的儲存庫的分支:https://git.ecker.tech/mrq/ai-voice-cloning。所有將 DLAS 訓練和 Tortoise 推理相結合的工作都屬於 mrq,他是原始 ai-voice-cloning 儲存庫的作者。
此儲存庫適用於具有 NVIDIA GPU 的 Windows和執行具有 NVIDIA GPU 的 Docker 的 Linux 。
start.bat
如果您手動安裝,您將需要:
git clone https://github.com/JarodMica/ai-voice-cloning.git
setup-cuda.bat
文件,它將開始運行所需的所有 python 套件start.bat
,這將開始下載您需要的大部分模型。models
資料夾中。setup-whipserx.bat
安裝 Whipserx 進行訓練確保安裝了最新的 nvidia 驅動程式: sudo ubuntu-drivers install
按照您喜歡的方式安裝 Docker。一種方法是遵循此處的官方文件。
如果在啟動語音複製 docker 時出現錯誤訊息,提示無法使用 GPU,則可能需要安裝 Nvidia Docker Container Toolkit。
使用“apt”方法安裝
運行docker配置命令
sudo nvidia-ctk runtime configure --runtime=docker
重啟docker
確保您的 Nvidia 驅動程式是最新的:https://www.nvidia.com/download/index.aspx
wsl --install
並重新啟動在 PowerShell 中安裝 WSL2ubuntu
。現在應該將您加載到 wsl2sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4
ubuntu
,然後依照下列步驟操作git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
./setup-docker.sh
建置映像./start-docker.sh
啟動容器http://localhost:7860
或使用http://<ip>:7860
遠端訪問如果無法存取遠端伺服器,請查看此線程
您可能還需要將本機資料夾重新對應到 Docker 資料夾。為此,您必須開啟“start-docker.sh”腳本,並更新一些行。例如,如果您想輕鬆找到生成的音頻,請在根目錄中建立一個“results”資料夾,然後在“start-docker.sh”中添加以下行:
-v "your/custom/path:/home/user/ai-voice-cloning/results"
查看 YouTube 影片:
首先觀看:https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf
第二次觀看(RVC 更新):https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s
如果您過去使用過此儲存庫,一切都與以前幾乎相同,但是,有一個新選項可以使用rvc
轉換文字輸出。在使用它之前,您需要從 RVC 或在線獲取經過訓練的RVC .pth 文件,然後需要將其放置在models/rvc_models/
中。 .index 和 .pth 檔案都可以放置在此處,它們將在各自的下拉式選單中正確顯示。
啟用 rvc:
Show Experimental Settings
以顯示更多選項Run the outputter audio through RVC
。現在您可以存取可在 RVC 中針對您正在使用的 RVC 語音模型進行調整的參數。 以下是如何更新軟體包以獲取最新更新
注意:如果有重大功能更改,請檢查最新版本以查看
update_package.bat
是否有效。如果沒有,您將需要從 Hugging Face 重新下載並重新解壓縮軟體包。
update_package.bat
文件您應該能夠導航到該資料夾,然後拉取儲存庫來更新它。
cd ai-voice-cloning
git pull
如果新增了大型功能,您可能需要刪除 venv 並重新執行 setup-cuda 腳本以確保不存在軟體包問題
您應該能夠導航到該資料夾,然後拉取儲存庫來更新它,然後重建您的 Docker 映像。
cd ai-voice-cloning
git pull
./setup-docker.sh
終端是你的朋友。當您嘗試運行時,任何錯誤或問題都會在終端中彈出,然後您可以從那裡開始偵錯。
.venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
如果您遇到任何問題,請在問題標籤上開啟新問題。
setup-cuda.bat
應該包含安裝軟體包所需的一切。所有不同的需求檔案使得腳本中變得非常混亂,但是每個儲存庫都安裝了它們的需求,最後,需要根目錄中的requirements.txt
將版本變更回該儲存庫的相容版本。