ai voice cloning 다운로드 - ai voice cloning 소스 코드 다운로드

ai voice cloning

기타 소스코드

v3.0

다운로드

AI 음성 복제

참고 저는 이 프로젝트의 개선/개선 작업을 적극적으로 수행할 계획이 없습니다. 이는 원래 git.ecker가 다운되거나 필요한 패키지 변경이 필요한 경우에 리포지토리를 작동 상태로 유지하기 위한 것입니다.

즉, 원래 저장소에 비해 몇 가지 향상된 기능이 추가되었습니다.

✔️ 다른 언어로 훈련 가능

✔️ Hifigan이 추가되어 품질을 희생하면서 더 빠른 추론이 가능해졌습니다.

✔️ 속삭임에 대한 선택 가능한 옵션으로 속삭임-v3 추가

✔️ RVC를 사용한 출력 변환

이것은 원래 여기에 있는 저장소의 포크입니다: https://git.ecker.tech/mrq/ai-voice-cloning. DLAS를 통한 훈련과 Tortoise의 추론을 통합하기 위해 여기에 투입된 모든 작업은 원래 ai 음성 복제 저장소의 저자인 mrq에 속합니다.

설정

이 저장소는 NVIDIA GPU가 있는 Windows 와 NVIDIA GPU가 있는 Docker를 실행하는 Linux 에서 작동합니다.

Windows 패키지(권장)

선택 사항이지만 권장됨: 컴퓨터에 7zip을 설치합니다: https://www.7-zip.org/
- 추출 문제가 발생하는 경우 7zip이 오래되었거나 다른 추출기를 사용하고 있기 때문일 가능성이 높습니다.
릴리스 탭으로 이동하여 Hugging Face의 최신 패키지를 다운로드하십시오: https://github.com/JarodMica/ai-voice-cloning/releases/tag/v3.0
7zip 아카이브를 추출합니다.
ai-voice-cloning을 열고 start.bat 실행하세요.

대체 수동 설치

수동으로 설치하는 경우 다음이 필요합니다.

파이썬 3.11: https://www.python.org/downloads/release/python-311/
힘내: https://www.git-scm.com/downloads

저장소 복제

 git clone https://github.com/JarodMica/ai-voice-cloning.git

setup-cuda.bat 파일을 실행하면 필요한 모든 Python 패키지가 실행되기 시작합니다.
- Python 3.11이 없으면 작동하지 않으므로 다운로드해야 합니다.
완료된 후 start.bat 실행하면 필요한 대부분의 모델 다운로드가 시작됩니다.
- 일부 모델은 처음 사용할 때 다운로드됩니다. 생성 중 및 교육(속삭임용) 시 추가 다운로드가 발생합니다. 그러나 일단 작업이 완료되면 삭제하지 않는 한 다시 다운로드할 필요가 없습니다. 루트의 models 폴더에 있습니다.
(선택 사항) setup-whipserx.bat 실행하여 교육용 Whipserx를 설치하도록 선택할 수 있습니다.
- 자세한 내용은 Whisperx github 페이지를 확인하세요. 긴 오디오 파일의 경우 훨씬 더 빠릅니다. 이미 분할된 데이터 세트를 하나씩 처리하는 경우에는 속도가 크게 향상되지 않습니다.

Linux(또는 WSL2)용 Docker

Linux 특정 설정

최신 nvidia 드라이버가 설치되어 있는지 확인하십시오: sudo ubuntu-drivers install
원하는 방식으로 Docker를 설치하세요. 이를 수행하는 한 가지 방법은 여기의 공식 문서를 따르는 것입니다.
- 이전 버전을 제거하여 시작하세요.
- "apt" 저장소 설치 방법을 따르십시오.
- 모든 것이 "hello-world" 컨테이너에서 작동하는지 확인하세요.
음성 복제 Docker를 시작할 때 GPU를 사용할 수 없다는 오류 메시지가 표시되면 Nvidia Docker Container Toolkit을 설치해야 할 수 있습니다.
- "apt" 방법으로 설치
- docker 구성 명령 실행
  sudo nvidia-ctk runtime configure --runtime=docker
- 도커 다시 시작

Windows 특정 설정

Nvidia 드라이버가 최신인지 확인하세요: https://www.nvidia.com/download/index.aspx

wsl --install 및 재시작을 사용하여 PowerShell에 WSL2를 설치합니다.
PowerShell을 열고 ubuntu 입력하고 입력하세요. 이제 wsl2에 로드되어야 합니다.
원래 nvidia 캐시 키 제거: sudo apt-key del 7fa2af80
CUDA 툴킷 키링 다운로드: wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
키링 설치: sudo dpkg -i cuda-keyring_1.1-1_all.deb
업데이트 패키지 목록: sudo apt-get update
CUDA 툴킷 설치: sudo apt-get -y install cuda-toolkit-12-4
WSL2를 백엔드로 사용하여 Docker Desktop 설치
다시 시작
SSH를 통해 원격으로 터미널을 모니터링하려면 이 가이드를 따르세요.
PowerShell을 열고 ubuntu 입력한 후 아래를 따르세요.

Docker에서 빌드 및 실행

터미널(또는 Ubuntu WSL) 열기
저장소 복제: git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
./setup-docker.sh 를 사용하여 이미지 빌드
./start-docker.sh 사용하여 컨테이너를 시작합니다.
http://localhost:7860 방문하거나 http://<ip>:7860 사용하여 원격으로 방문하세요.

원격 서버에 연결할 수 없는 경우 이 스레드를 확인하세요.

로컬 폴더를 Docker 폴더에 다시 매핑해야 할 수도 있습니다. 이렇게 하려면 "start-docker.sh" 스크립트를 열고 일부 줄을 업데이트해야 합니다. 예를 들어, 생성된 오디오를 쉽게 찾으려면 루트 디렉터리에 "results" 폴더를 만든 다음 "start-docker.sh"에 다음 줄을 추가하세요.

-v "your/custom/path:/home/user/ai-voice-cloning/results"

지침

YouTube 동영상을 확인하세요:

먼저 시청하세요: https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf

두 번째 시청(RVC 업데이트): https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s

과거에 이 저장소를 사용한 적이 있다면 모든 것이 이전과 거의 동일하지만 rvc 사용하여 텍스트 출력을 변환하는 새로운 옵션이 있습니다. 이를 사용하려면 먼저 RVC 또는 온라인에서 얻은 훈련된 RVC .pth 파일이 필요하며, 그런 다음 이를 models/rvc_models/ 에 배치해야 합니다. .index 및 .pth 파일을 모두 여기에 배치할 수 있으며 해당 드롭다운 메뉴에 올바르게 표시됩니다.

rvc를 활성화하려면:

더 많은 옵션을 표시하려면 Show Experimental Settings 선택하고 활성화하세요.
Run the outputter audio through RVC 확인하고 활성화합니다. 이제 사용 중인 RVC 음성 모델에 대해 RVC에서 조정할 수 있는 매개변수에 액세스할 수 있습니다.

설치 업데이트

다음은 최신 업데이트로 패키지를 업데이트하는 방법입니다.

윈도우

참고: 주요 기능 변경이 있는 경우 최신 릴리스를 확인하여 update_package.bat 작동하는지 확인하십시오. 그렇지 않은 경우 Hugging Face에서 패키지를 다시 다운로드하고 다시 추출해야 합니다.

update_package.bat 파일을 실행하십시오.
- 저장소를 복제하고 저장소의 src 폴더를 패키지로 복사합니다.

대체 수동 설치

폴더로 이동한 다음 저장소를 가져와 업데이트할 수 있어야 합니다.

 cd ai-voice-cloning
git pull

대규모 기능이 추가된 경우 venv를 삭제하고 setup-cuda 스크립트를 다시 실행하여 패키지 문제가 없는지 확인해야 할 수도 있습니다.

도커를 통한 리눅스

폴더로 이동한 다음 저장소를 가져와서 업데이트하고 Docker 이미지를 다시 빌드할 수 있어야 합니다.

 cd ai-voice-cloning
git pull
./setup-docker.sh

선적 서류 비치

수동 설치 문제 해결

터미널은 당신의 친구입니다. 시도하고 실행하려고 하면 터미널에 오류나 문제가 팝업으로 표시되고 거기에서 디버깅을 시작할 수 있습니다.

도중에 토치가 엉망이 되면 다시 설치해야 할 수도 있습니다. 제거한 후 다음과 같이 다시 설치해야 합니다. 삭제를 확인하려면 (Y)를 입력하세요.

 .venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

버그 보고

문제가 발생하면 문제 탭에서 새 문제를 열어주세요.

개발자를 위한 팁

setup-cuda.bat 패키지 설치에 필요한 모든 것이 있어야 합니다. 서로 다른 모든 요구 사항 파일로 인해 스크립트가 상당히 혼란스러워지지만 각 저장소에는 해당 요구 사항이 설치되어 있으며 마지막에 이 저장소에 대해 호환 가능한 버전으로 버전을 다시 변경하려면 루트의 requirements.txt 가 필요합니다.

확장하다

추가 정보