MockingBird es un sistema de onomatopeyas de IA que puede clonar tu voz y generar contenido de voz arbitrario.
característica
1. El texto es compatible con mandarín y se prueba utilizando una variedad de conjuntos de datos chinos: aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell, etc.
2. PyTorch es adecuado para pytorch, se ha probado en 1.9.0 (la última versión de agosto de 2021), GPU Tesla T4 y GTX 2060.
3. Windows + Linux se puede ejecutar en el sistema operativo Windows y el sistema operativo Linux (la versión M1 del sistema Apple también tiene casos de operación comunitaria exitosa)
4. Fácil e impresionante Simplemente descargue o entrene nuevamente el sintetizador (sintetizador) para lograr buenos resultados, reutilice el codificador/vocoder previamente entrenado o HiFi-GAN en tiempo real como vocoder
5. Webserver Ready puede ofrecer los resultados de su capacitación para llamadas remotas
comenzar
Requisitos de instalación
Siga el repositorio original para probar si tiene todos sus entornos listos. Se requiere Python 3.7 o superior para ejecutar la caja de herramientas.
Instale PyTorch.
Si se produce ERROR: No se pudo encontrar una versión que satisfaga el requisito torch==1.9.0+cu102 (de las versiones: 0.1.2, 0.1.2.post1, 0.1.2.post2) al instalar con pip. Puede ser que Python es demasiado bajo, 3.9 se puede instalar correctamente
Instale ffmpeg.
Ejecute pip install -r requisitos.txt para instalar los paquetes necesarios restantes.
Instale webrtcvad pip instale webrtcvad-wheels.