참고 저는 이 프로젝트의 개선/개선 작업을 적극적으로 수행할 계획이 없습니다. 이는 원래 git.ecker가 다운되거나 필요한 패키지 변경이 필요한 경우에 리포지토리를 작동 상태로 유지하기 위한 것입니다.
즉, 원래 저장소에 비해 몇 가지 향상된 기능이 추가되었습니다.
✔️ 다른 언어로 훈련 가능
✔️ Hifigan이 추가되어 품질을 희생하면서 더 빠른 추론이 가능해졌습니다.
✔️ 속삭임에 대한 선택 가능한 옵션으로 속삭임-v3 추가
✔️ RVC를 사용한 출력 변환
이것은 원래 여기에 있는 저장소의 포크입니다: https://git.ecker.tech/mrq/ai-voice-cloning. DLAS를 통한 훈련과 Tortoise의 추론을 통합하기 위해 여기에 투입된 모든 작업은 원래 ai 음성 복제 저장소의 저자인 mrq에 속합니다.
이 저장소는 NVIDIA GPU가 있는 Windows 와 NVIDIA GPU가 있는 Docker를 실행하는 Linux 에서 작동합니다.
start.bat
실행하세요. 수동으로 설치하는 경우 다음이 필요합니다.
git clone https://github.com/JarodMica/ai-voice-cloning.git
setup-cuda.bat
파일을 실행하면 필요한 모든 Python 패키지가 실행되기 시작합니다.start.bat
실행하면 필요한 대부분의 모델 다운로드가 시작됩니다.models
폴더에 있습니다.setup-whipserx.bat
실행하여 교육용 Whipserx를 설치하도록 선택할 수 있습니다. 최신 nvidia 드라이버가 설치되어 있는지 확인하십시오: sudo ubuntu-drivers install
원하는 방식으로 Docker를 설치하세요. 이를 수행하는 한 가지 방법은 여기의 공식 문서를 따르는 것입니다.
음성 복제 Docker를 시작할 때 GPU를 사용할 수 없다는 오류 메시지가 표시되면 Nvidia Docker Container Toolkit을 설치해야 할 수 있습니다.
"apt" 방법으로 설치
docker 구성 명령 실행
sudo nvidia-ctk runtime configure --runtime=docker
도커 다시 시작
Nvidia 드라이버가 최신인지 확인하세요: https://www.nvidia.com/download/index.aspx
wsl --install
및 재시작을 사용하여 PowerShell에 WSL2를 설치합니다.ubuntu
입력하고 입력하세요. 이제 wsl2에 로드되어야 합니다.sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4
ubuntu
입력한 후 아래를 따르세요. git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
./setup-docker.sh
를 사용하여 이미지 빌드./start-docker.sh
사용하여 컨테이너를 시작합니다.http://localhost:7860
방문하거나 http://<ip>:7860
사용하여 원격으로 방문하세요.원격 서버에 연결할 수 없는 경우 이 스레드를 확인하세요.
로컬 폴더를 Docker 폴더에 다시 매핑해야 할 수도 있습니다. 이렇게 하려면 "start-docker.sh" 스크립트를 열고 일부 줄을 업데이트해야 합니다. 예를 들어, 생성된 오디오를 쉽게 찾으려면 루트 디렉터리에 "results" 폴더를 만든 다음 "start-docker.sh"에 다음 줄을 추가하세요.
-v "your/custom/path:/home/user/ai-voice-cloning/results"
YouTube 동영상을 확인하세요:
먼저 시청하세요: https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf
두 번째 시청(RVC 업데이트): https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s
과거에 이 저장소를 사용한 적이 있다면 모든 것이 이전과 거의 동일하지만 rvc
사용하여 텍스트 출력을 변환하는 새로운 옵션이 있습니다. 이를 사용하려면 먼저 RVC 또는 온라인에서 얻은 훈련된 RVC .pth 파일이 필요하며, 그런 다음 이를 models/rvc_models/
에 배치해야 합니다. .index 및 .pth 파일을 모두 여기에 배치할 수 있으며 해당 드롭다운 메뉴에 올바르게 표시됩니다.
rvc를 활성화하려면:
Show Experimental Settings
선택하고 활성화하세요.Run the outputter audio through RVC
확인하고 활성화합니다. 이제 사용 중인 RVC 음성 모델에 대해 RVC에서 조정할 수 있는 매개변수에 액세스할 수 있습니다. 다음은 최신 업데이트로 패키지를 업데이트하는 방법입니다.
참고: 주요 기능 변경이 있는 경우 최신 릴리스를 확인하여
update_package.bat
작동하는지 확인하십시오. 그렇지 않은 경우 Hugging Face에서 패키지를 다시 다운로드하고 다시 추출해야 합니다.
update_package.bat
파일을 실행하십시오.폴더로 이동한 다음 저장소를 가져와 업데이트할 수 있어야 합니다.
cd ai-voice-cloning
git pull
대규모 기능이 추가된 경우 venv를 삭제하고 setup-cuda 스크립트를 다시 실행하여 패키지 문제가 없는지 확인해야 할 수도 있습니다.
폴더로 이동한 다음 저장소를 가져와서 업데이트하고 Docker 이미지를 다시 빌드할 수 있어야 합니다.
cd ai-voice-cloning
git pull
./setup-docker.sh
터미널은 당신의 친구입니다. 시도하고 실행하려고 하면 터미널에 오류나 문제가 팝업으로 표시되고 거기에서 디버깅을 시작할 수 있습니다.
.venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
문제가 발생하면 문제 탭에서 새 문제를 열어주세요.
setup-cuda.bat
패키지 설치에 필요한 모든 것이 있어야 합니다. 서로 다른 모든 요구 사항 파일로 인해 스크립트가 상당히 혼란스러워지지만 각 저장소에는 해당 요구 사항이 설치되어 있으며 마지막에 이 저장소에 대해 호환 가능한 버전으로 버전을 다시 변경하려면 루트의 requirements.txt
가 필요합니다.