VITS 기반의 간단하고 사용하기 쉬운 음성 변경 프레임워크
로그 업데이트 | AutoDL·5센트로 AI 가수 양성 | 온라인 시연 |
English |中文简体|日本语| 한국어 ( 한국어 ) |
기본 모델은 약 50시간의 오픈 소스 고품질 VCTK 교육 세트를 사용하여 교육됩니다. 저작권 문제가 없으므로 자유롭게 사용하십시오.
더 큰 매개변수, 더 큰 데이터, 더 나은 결과, 기본적으로 동일한 추론 속도를 가지며 더 적은 훈련 데이터가 필요한 RVCv3의 하단 모델을 기대하십시오.
훈련 추론 인터페이스 | 실시간 음성 변경 인터페이스 |
go-web.bat | go-realtime-gui.bat |
당신은 당신이하고 싶은 것을 자유롭게 선택할 수 있습니다. | 우리는 170ms의 엔드 투 엔드 대기 시간을 달성했습니다. ASIO 입력 및 출력 장치를 사용하는 경우 종단 간 90ms의 대기 시간을 달성할 수 있지만 하드웨어 드라이버 지원에 크게 의존합니다. |
이 창고는 다음과 같은 특징을 가지고 있습니다
음색 누출을 방지하기 위해 top1 검색을 사용하여 입력 소스 기능을 트레이닝 세트 기능으로 대체합니다.
상대적으로 열악한 그래픽 카드에서도 빠른 훈련
훈련에 소량의 데이터를 사용하는 것도 더 나은 결과를 얻을 수 있습니다. (최소 10분 이상의 저잡음 음성 데이터를 수집하는 것이 좋습니다)
모델 융합을 통해 음색을 변경할 수 있습니다(ckpt 처리 탭에서 ckpt-merge를 사용하여).
간단하고 사용하기 쉬운 웹 인터페이스
UVR5 모델을 호출하면 보컬과 반주를 빠르게 분리할 수 있습니다.
가장 발전된 인간 음성 피치 추출 알고리즘 InterSpeech2023-RMVPE를 사용하여 음소거 문제를 제거합니다. (상당히) 가장 잘 작동하지만 crepe_full보다 빠르고 작습니다.
카드 I 카드 가속 지원
데모 비디오를 보려면 여기를 클릭하세요!
다음 지침은 Python 버전이 3.8 이상인 환경에서 실행해야 합니다.
다음 방법 중 하나를 선택하십시오.
Pytorch와 핵심 종속성을 설치하고, 이미 설치된 경우 건너뜁니다. 참조 출처: https://pytorch.org/get-started/locally/
pip 설치 토치 torchvision torchaudio
win 시스템 + Nvidia Ampere 아키텍처(RTX30xx)인 경우 #21의 경험에 따르면 pytorch에 해당하는 cuda 버전을 지정해야 합니다.
pip 설치 토치 torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
자신의 그래픽 카드에 따라 해당 종속성을 설치하십시오.
N카드
pip 설치 -r 요구사항.txt
A카드/I카드
pip 설치 -r 요구사항-dml.txt
카드 ROCM(리눅스)
pip 설치 -r 요구사항-amd.txt
아이카드IPEX(리눅스)
pip 설치 -r 요구사항-ipex.txt
Poetry 종속성 관리 도구를 설치하고, 이미 설치되어 있으면 건너뜁니다. 참조 출처: https://python-poetry.org/docs/#installation
컬 -sSL https://install.python-poetry.org python3 -
Poetry를 통해 종속성을 설치할 때 Python 버전 3.7-3.10을 사용하는 것이 좋습니다. 다른 버전은 llvmlite==0.39.0을 설치할 때 충돌합니다.
시 초기화 -n 시 환경에서는 "python.exe 경로"를 사용합니다. poetry run pip install -r 요구사항.txt
run.sh
통해 종속성을 설치할 수 있습니다.
sh./run.sh
RVC에는 추론 및 훈련을 위한 몇 가지 다른 사전 모델이 필요합니다.
Hugging Face 공간에서 이러한 모델을 다운로드할 수 있습니다.
다음은 RVC에 필요한 모든 사전 모델 및 기타 파일의 이름이 포함된 목록입니다. tools
폴더에서 다운로드할 스크립트를 찾을 수 있습니다.
./assets/hubert/hubert_base.pt
./assets/사전 훈련됨
./assets/uvr5_weights
v2 버전 모델을 사용하시려면 추가로 다운로드가 필요합니다.
./assets/pretrained_v2
ffmpeg 및 ffprobe가 이미 설치되어 있으면 건너뜁니다.
sudo apt 설치 ffmpeg
양조 설치 ffmpeg
다운로드 후 루트디렉토리에 넣어주세요.
ffmpeg.exe 다운로드
ffprobe.exe 다운로드
최신 RMVPE 보컬 피치 추출 알고리즘을 사용하려면 피치 추출 모델 매개변수를 다운로드하여 RVC 루트 디렉터리에 배치해야 합니다.
다운로드rmvpe.pt
다운로드rmvpe.onnx
AMD의 Rocm 기술을 기반으로 하는 Linux 시스템에서 RVC를 실행하려면 먼저 여기에서 필요한 드라이버를 설치하십시오.
Arch Linux를 사용하는 경우 pacman을 사용하여 필요한 드라이버를 설치할 수 있습니다.
pacman -S rocm-hip-sdk rocm-opencl-sdk
일부 그래픽 카드 모델의 경우 다음 환경 변수를 추가로 구성해야 할 수도 있습니다(예: RX6700XT).
export ROCM_PATH=/opt/rocm export HSA_OVERRIDE_GFX_VERSION=10.3.0
또한 현재 사용자가 render
및 video
사용자 그룹에 있는지 확인하십시오.
sudo usermod -aG render $USERNAME sudo usermod -aG video $USERNAME
WebUI를 시작하려면 다음 명령을 사용하십시오.
파이썬 추론-web.py
이전에 Poetry를 사용하여 종속성을 설치한 경우 다음 방법으로 WebUI를 시작할 수 있습니다.
시는 Python infer-web.py를 실행합니다.
RVC-beta.7z
다운로드 및 압축 해제
go-web.bat
두 번 클릭합니다.
sh./run.sh
소스 /opt/intel/oneapi/setvars.sh