RVC v2 UI 다운로드 - RVC v2 UI 소스 코드 다운로드

RVC v2 UI

VC/VC++

다운로드

RVC 보이스 체인저

RVC v2 교육을 받은 AI 음성 모델을 사용하여 음성을 변경하는 자율 파이프라인입니다. 이 도구는 모든 오디오 입력에 음성 변환을 적용하는 데 사용할 수 있습니다.

WebUI는 지속적으로 개발 및 테스트 중이지만 지금 바로 로컬에서 사용해 볼 수 있습니다!

RVC 보이스 체인저를 최신 버전으로 업데이트하세요

RVC-v2-UI 디렉터리에서 명령줄 창을 열고 다음 명령을 실행하여 새로운 요구 사항 및 변경 사항을 설치하고 가져옵니다.

pip install -r requirements.txt
git pull

Colab 사용자의 경우 Colab 노트북 상단 탐색 모음에서 Runtime 클릭하고 드롭다운 메뉴에서 Disconnect and delete runtime 클릭하면 됩니다. 그런 다음 노트북의 지침에 따라 webui를 실행합니다.

Colab 노트북

(곧 출시되길 바랍니다)

설정

Git과 Python 설치

컴퓨터에 Git을 설치하려면 여기 지침을 따르세요. 또한 아직 설치하지 않았다면 이 가이드에 따라 Python VERSION 3.9를 설치하세요. 다른 버전의 Python을 사용하면 종속성 충돌이 발생할 수 있습니다.

또는 pyenv를 사용하여 Python 버전을 관리할 수 있습니다.

여기의 지침에 따라 pyenv를 설치하세요.
Python 3.9를 설치합니다.

pyenv install 3.9

로컬 Python 버전으로 설정합니다.

pyenv local 3.9

ffmpeg 설치

컴퓨터에 ffmpeg를 설치하려면 여기 지침을 따르세요.

RVC-v2-UI 저장소 복제 및 가상 환경 설정

명령줄 창을 열고 다음 명령을 실행하여 전체 저장소를 복제하고, 가상 환경을 생성하고, 필요한 추가 종속성을 설치합니다.

git clone https://github.com/PseudoRAM/RVC-v2-UI
cd RVC-v2-UI

가상 환경 생성 및 활성화

pyenv 사용

pyenv exec python -m venv venv

pyenv를 사용하지 않음

python -m venv venv

가상 환경 활성화

윈도우

venvScriptsactivate

맥OS와 리눅스

source venv/bin/activate

종속성 설치

pip install -r requirements.txt

필요한 모델 다운로드

다음 명령을 실행하여 필요한 Hubert 기본 모델을 다운로드하세요.

python src/download_models.py

WebUI와 함께 사용

RVC Voice Changer WebUI를 실행하려면 다음 명령을 실행하십시오.

python src/webui.py

깃발	설명
`-h` , `--help`	이 도움말 메시지를 표시하고 종료합니다.
`--share`	공개 URL을 만듭니다. 이는 Google Colab에서 웹 UI를 실행하는 데 유용합니다.
`--listen`	로컬 네트워크에서 웹 UI에 연결할 수 있도록 합니다.
`--listen-host LISTEN_HOST`	서버가 사용할 호스트 이름입니다.
`--listen-port LISTEN_PORT`	서버가 사용할 수신 포트입니다.

다음 출력 메시지 Running on local URL: http://127.0.0.1:7860 나타나면 링크를 클릭하여 WebUI가 있는 탭을 열 수 있습니다.

WebUI를 통해 RVC 모델 다운로드

Download model 탭으로 이동하여 다운로드 링크를 RVC 모델에 붙여넣고 고유한 이름을 지정합니다. 이미 훈련된 음성 모델을 다운로드할 수 있는 AI Hub Discord를 검색할 수 있습니다. 다운로드 링크의 모양에 대한 예를 참조할 수 있습니다. 다운로드한 zip 파일에는 .pth 모델 파일과 선택적 .index 파일이 포함되어 있어야 합니다.

2개의 입력 필드가 채워지면 Download 클릭하기만 하면 됩니다! 출력 메시지에 [NAME] Model successfully downloaded! , 모델 새로 고침 버튼을 클릭한 후 Convert Voice 탭에서 사용할 수 있습니다!

WebUI를 통해 RVC 모델 업로드

RVC v2 모델을 로컬에서 훈련했으며 이를 음성 변환에 사용하려는 사람들을 위한 것입니다. Upload model 탭으로 이동하여 지침을 따릅니다. 출력 메시지에 [NAME] Model successfully uploaded! , 모델 새로 고침 버튼을 클릭한 후 Convert Voice 탭에서 사용할 수 있습니다!

WebUI를 통해 파이프라인 실행

webui_generate (1).png

음성 모델 드롭다운 메뉴에서 사용할 음성 모델을 선택하세요. 목록을 새로 고치기 위해 rvc_models 디렉터리에 파일을 수동으로 추가한 경우 Refresh Models 클릭합니다.
입력 오디오 필드에서 오디오 파일을 업로드합니다.
필요에 따라 피치를 조정하십시오. 출력 음성의 피치가 변경됩니다.
음성 변환을 위한 다른 고급 옵션은 아코디언 화살표를 클릭하여 확장하면 볼 수 있습니다.

모든 옵션을 입력한 후 Convert 클릭하면 GPU에 따라 AI 생성 음성이 잠시 후에 나타납니다.

CLI를 사용한 사용법

파이프라인 실행

명령줄을 사용하여 음성 변환 파이프라인을 실행하려면 다음 명령을 실행합니다.

python src/main.py <input_audio> <rvc_model> [pitch] [f0_method] [index_rate] [filter_radius] [rms_mix_rate] [protect]

매개변수	설명
`input_audio`	입력 오디오 파일의 경로입니다.
`rvc_model`	사용할 RVC 모델의 이름입니다.
`pitch`	(선택 사항) 반음 단위로 피치를 변경합니다. 기본값은 0입니다.
`f0_method`	(선택 사항) 피치 감지 알고리즘. 옵션: 'rmvpe'(기본값) 또는 'mangio-crepe'.
`index_rate`	(선택 사항) 음성 변환의 인덱스 속도입니다. 기본값은 0.5입니다. 범위: 0~1.
`filter_radius`	(선택 사항) 중앙값 필터링을 위한 필터 반경입니다. 기본값은 3입니다. 범위: 0~7.
`rms_mix_rate`	(선택 사항) RMS 혼합 속도. 기본값은 0.25입니다. 범위: 0~1.
`protect`	(선택 사항) 일부 원래 음성 특성을 보존하기 위해 속도를 보호합니다. 기본값은 0.33입니다. 범위: 0~0.5.

사용 예:

python src/main.py "path/to/input/audio.wav" "JohnDoe" 2 rmvpe 0.7 3 0.3 0.35

이 명령은 "JohnDoe" RVC 모델을 사용하여 "audio.wav"의 음성을 변환하고 'rmvpe' 피치 감지 알고리즘을 사용하여 피치를 2 반음 올립니다. 인덱스 속도는 0.7, 필터 반경은 3, RMS 믹스입니다. 비율은 0.3, 보호 비율은 0.35입니다.

RVC 모델 수동 다운로드

필요한 경우 압축을 풀고 .pth 및 .index 파일을 rvc_models 디렉터리의 새 폴더로 전송합니다. 각 폴더에는 하나의 .pth 과 하나의 .index 파일만 포함되어야 합니다.

디렉터리 구조는 다음과 같아야 합니다.

├── rvc_models
│   ├── John
│   │   ├── JohnV2.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── May
│   │   ├── May.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── MODELS.txt
│   └── hubert_base.pt
├── voice_output
└── src