Um pipeline autônomo para alterar vozes usando qualquer modelo de voz de IA treinado em RVC v2. Esta ferramenta pode ser usada para aplicar conversão de voz a qualquer entrada de áudio.
O WebUI está em constante desenvolvimento e testes, mas você pode testá-lo agora mesmo no local!
Instale e extraia quaisquer novos requisitos e alterações abrindo uma janela de linha de comandos no diretório RVC-v2-UI
e executando os comandos a seguir.
pip install -r requirements.txt git pull
Para usuários do Colab, basta clicar em Runtime
na barra de navegação superior do notebook Colab e Disconnect and delete runtime
no menu suspenso. Em seguida, siga as instruções do notebook para executar o webui.
(Espero que em breve)
Siga as instruções aqui para instalar o Git no seu computador. Siga também este guia para instalar o Python VERSÃO 3.9, caso ainda não o tenha feito. Usar outras versões do Python pode resultar em conflitos de dependência.
Alternativamente, você pode usar pyenv para gerenciar versões do Python:
Instale o pyenv seguindo as instruções aqui.
Instale o Python 3.9:
pyenv install 3.9
Defina-o como sua versão local do Python:
pyenv local 3.9
Siga as instruções aqui para instalar o ffmpeg no seu computador.
Abra uma janela de linha de comando e execute estes comandos para clonar todo o repositório, criar um ambiente virtual e instalar as dependências adicionais necessárias.
git clone https://github.com/PseudoRAM/RVC-v2-UI cd RVC-v2-UI
pyenv exec python -m venv venv
python -m venv venv
venvScriptsactivate
source venv/bin/activate
pip install -r requirements.txt
Execute o seguinte comando para baixar o modelo base de Hubert necessário.
python src/download_models.py
Para executar o RVC Voice Changer WebUI, execute o seguinte comando.
python src/webui.py
Bandeira | Descrição |
---|---|
-h , --help | Mostre esta mensagem de ajuda e saia. |
--share | Crie um URL público. Isso é útil para executar a IU da web no Google Colab. |
--listen | Torne a IU da web acessível em sua rede local. |
--listen-host LISTEN_HOST | O nome do host que o servidor usará. |
--listen-port LISTEN_PORT | A porta de escuta que o servidor usará. |
Assim que a seguinte mensagem de saída Running on local URL: http://127.0.0.1:7860
aparecer, você pode clicar no link para abrir uma guia com a WebUI.
Navegue até a guia Download model
e cole o link de download no modelo RVC e dê a ele um nome exclusivo. Você pode pesquisar no AI Hub Discord onde modelos de voz já treinados estão disponíveis para download. Você pode consultar os exemplos de como deve ser a aparência do link de download. O arquivo zip baixado deve conter o arquivo de modelo .pth e um arquivo .index opcional.
Assim que os 2 campos de entrada forem preenchidos, basta clicar em Download
! Assim que a mensagem de saída disser [NAME] Model successfully downloaded!
, você poderá usá-lo na guia Convert Voice
depois de clicar no botão Atualizar modelos!
Para pessoas que treinaram modelos RVC v2 localmente e gostariam de usá-los para conversão de voz. Navegue até a guia Upload model
e siga as instruções. Assim que a mensagem de saída disser [NAME] Model successfully uploaded!
, você poderá usá-lo na guia Convert Voice
depois de clicar no botão Atualizar modelos!
No menu suspenso Modelos de voz, selecione o modelo de voz a ser usado. Clique em Refresh Models
se você incluiu os arquivos manualmente no diretório rvc_models para atualizar a lista.
No campo Entrada de áudio, carregue seu arquivo de áudio.
Ajuste o tom conforme necessário. Isso altera o tom da voz de saída.
Outras opções avançadas para conversão de voz podem ser visualizadas clicando na seta sanfonada para expandir.
Depois que todas as opções estiverem preenchidas, clique em Convert
e a voz gerada pela IA deverá aparecer em alguns instantes, dependendo da sua GPU.
Para executar o pipeline de conversão de voz usando a linha de comando, execute o seguinte comando:
python src/main.py[pitch] [f0_method] [index_rate] [filter_radius] [rms_mix_rate] [protect]
Parâmetro | Descrição |
---|---|
input_audio | Caminho para o arquivo de áudio de entrada. |
rvc_model | Nome do modelo RVC a ser usado. |
pitch | (Opcional) Mudança de tom em semitons. O padrão é 0. |
f0_method | (Opcional) Algoritmo de detecção de pitch. Opções: 'rmvpe' (padrão) ou 'mangio-crepe'. |
index_rate | (Opcional) Taxa de índice para conversão de voz. O padrão é 0,5. Faixa: 0 a 1. |
filter_radius | (Opcional) Raio de filtro para filtragem mediana. O padrão é 3. Faixa: 0 a 7. |
rms_mix_rate | (Opcional) Taxa de mixagem RMS. O padrão é 0,25. Faixa: 0 a 1. |
protect | (Opcional) Proteja a taxa para preservar algumas características originais da voz. O padrão é 0,33. Faixa: 0 a 0,5. |
Exemplo de uso:
python src/main.py "path/to/input/audio.wav" "JohnDoe" 2 rmvpe 0.7 3 0.3 0.35
Este comando irá converter a voz em "audio.wav" usando o modelo RVC "JohnDoe", aumentando o pitch em 2 semitons, usando o algoritmo de detecção de pitch 'rmvpe', com taxa de índice de 0,7, raio de filtro de 3, mix RMS taxa de 0,3 e taxa de proteção de 0,35.
Descompacte (se necessário) e transfira os arquivos .pth
e .index
para uma nova pasta no diretório rvc_models. Cada pasta deve conter apenas um .pth
e um arquivo .index
.
A estrutura de diretórios deve ser semelhante a esta:
├── rvc_models │ ├── John │ │ ├── JohnV2.pth │ │ └── added_IVF2237_Flat_nprobe_1_v2.index │ ├── May │ │ ├── May.pth │ │ └── added_IVF2237_Flat_nprobe_1_v2.index │ ├── MODELS.txt │ └── hubert_base.pt ├── voice_output └── src
É proibido o uso da voz convertida para os seguintes fins.
Criticar ou atacar indivíduos.
Defender ou opor-se a posições políticas, religiões ou ideologias específicas.
Exibindo publicamente expressões fortemente estimulantes sem zoneamento adequado.
Venda de modelos de voz e clipes de voz gerados.
Representação do proprietário original da voz com intenções maliciosas de prejudicar/ferir outras pessoas.
Fins fraudulentos que levam ao roubo de identidade ou chamadas telefônicas fraudulentas.
Não sou responsável por quaisquer danos diretos, indiretos, consequenciais, incidentais ou especiais decorrentes ou de alguma forma relacionados ao uso/uso indevido ou incapacidade de uso deste software.