MockingBird é um sistema de onomatopeia de IA que pode clonar sua voz e gerar conteúdo de fala arbitrário.
característica
1. O texto suporta mandarim e é testado usando uma variedade de conjuntos de dados chineses: adatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell, etc.
2. PyTorch é adequado para pytorch, foi testado em 1.9.0 (mais recente em agosto de 2021), GPU Tesla T4 e GTX 2060
3. Windows + Linux pode ser executado no sistema operacional Windows e no sistema operacional Linux (a versão M1 do sistema Apple também possui casos de operação comunitária bem-sucedidos)
4. Fácil e incrível Basta baixar ou treinar novamente o sintetizador (sintetizador) para obter bons resultados, reutilizar o codificador/vocoder pré-treinado ou HiFi-GAN em tempo real como o vocoder
5. Webserver Ready pode fornecer os resultados do seu treinamento para chamadas remotas
começar
Requisitos de instalação
Siga o repositório original para testar se todos os seus ambientes estão prontos. É necessário Python 3.7 ou superior para executar a caixa de ferramentas.
Instale o PyTorch.
Se ERRO: Não foi possível encontrar uma versão que satisfaça o requisito torch==1.9.0+cu102 (das versões: 0.1.2, 0.1.2.post1, 0.1.2.post2) ocorre ao instalar com pip Pode ser que python é muito baixo, 3.9 pode ser instalado com sucesso
Instale o ffmpeg.
Execute pip install -r requisitos.txt para instalar os pacotes necessários restantes.
Instale o webrtcvad pip instale as rodas do webrtcvad.