MockingBird ist ein KI-Lautmalereisystem, das Ihre Stimme klonen und beliebige Sprachinhalte generieren kann.
Merkmal
1. Der Text unterstützt Mandarin und wird mit verschiedenen chinesischen Datensätzen getestet: aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell usw.
2. PyTorch ist für Pytorch geeignet, wurde in 1.9.0 (spätestens im August 2021), GPU Tesla T4 und GTX 2060 getestet
3. Windows + Linux kann unter Windows-Betriebssystemen und Linux-Betriebssystemen ausgeführt werden (die M1-Version des Apple-Systems verfügt auch über erfolgreiche Community-Betriebsfälle).
4. Einfach und großartig: Laden Sie einfach den Synthesizer (Synthesizer) herunter oder trainieren Sie ihn neu, um gute Ergebnisse zu erzielen. Verwenden Sie den vorab trainierten Encoder/Vocoder oder Echtzeit-HiFi-GAN als Vocoder
5. Webserver Ready kann Ihre Trainingsergebnisse für Fernanrufe bereitstellen
Start
Installationsanforderungen
Folgen Sie dem Original-Repository, um zu testen, ob alle Ihre Umgebungen bereit sind. Zum Ausführen der Toolbox ist Python 3.7 oder höher erforderlich.
Installieren Sie PyTorch.
Wenn bei der Installation mit pip FEHLER: Es konnte keine Version gefunden werden, die die Anforderungen erfüllt, Torch==1.9.0+cu102 (aus Versionen: 0.1.2, 0.1.2.post1, 0.1.2.post2) auftritt, kann es sich um Python handeln zu niedrig ist, kann 3.9 erfolgreich installiert werden
Installieren Sie ffmpeg.
Führen Sie pip install -r require.txt aus, um die verbleibenden erforderlichen Pakete zu installieren.
Installieren Sie webrtcvad pip und installieren Sie webrtcvad-wheels.