MockingBird est un système d'onomatopées d'IA qui peut cloner votre voix et générer un contenu vocal arbitraire.
caractéristiques
1. Le texte prend en charge le mandarin et est testé à l'aide de divers ensembles de données chinois : aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell, etc.
2. PyTorch est adapté à pytorch, a été testé en 1.9.0 (dernier en août 2021), GPU Tesla T4 et GTX 2060
3. Windows + Linux peuvent fonctionner sur le système d'exploitation Windows et le système d'exploitation Linux (la version Apple System M1 a également des cas d'opération communautaire réussis)
4. Facile et génial Téléchargez simplement ou entraînez nouvellement le synthétiseur (synthétiseur) pour obtenir de bons résultats, réutilisez l'encodeur/vocodeur pré-entraîné ou le HiFi-GAN en temps réel comme vocodeur
5. Webserver Ready peut servir vos résultats de formation pour les appels à distance
commencer
Exigences d'installation
Suivez le référentiel d'origine pour tester si tous vos environnements sont prêts. Python 3.7 ou supérieur est requis pour exécuter la boîte à outils.
Installez PyTorch.
Si ERREUR : Impossible de trouver une version qui satisfait à l'exigence torch==1.9.0+cu102 (à partir des versions : 0.1.2, 0.1.2.post1, 0.1.2.post2) se produit lors de l'installation avec pip Il se peut que python est trop faible, la version 3.9 peut être installée avec succès
Installez ffmpeg.
Exécutez pip install -r Requirements.txt pour installer les packages nécessaires restants.
Installez webrtcvad pip installez webrtcvad-wheels.