MockingBird — это звукоподражательная система искусственного интеллекта, которая может клонировать ваш голос и генерировать произвольный речевой контент.
характеристика
1. Текст поддерживает мандаринский диалект и тестируется с использованием различных наборов данных на китайском языке: aidatatang_200zh, Magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell и т. д.
2. PyTorch подходит для pytorch, протестирован в версии 1.9.0 (последняя версия — август 2021 г.), графический процессор Tesla T4 и GTX 2060.
3. Windows + Linux может работать в операционных системах Windows и Linux (версия системы Apple M1 также имеет успешные случаи работы сообщества)
4. Легко и потрясающе. Просто загрузите или заново обучите синтезатор (синтезатор) для достижения хороших результатов, повторно используйте предварительно обученный кодер/вокодер или HiFi-GAN реального времени в качестве вокодера.
5. Webserver Ready может предоставлять результаты вашего обучения для удаленных вызовов.
начинать
Требования к установке
Следуйте исходному репозиторию, чтобы проверить, готовы ли все ваши среды. Для запуска набора инструментов требуется Python 3.7 или выше.
Установите ПиТорч.
Если при установке с помощью pip возникает ОШИБКА: Не удалось найти версию, удовлетворяющую требованию torch==1.9.0+cu102 (из версий: 0.1.2, 0.1.2.post1, 0.1.2.post2). Возможно, это Python слишком мало, 3.9 можно успешно установить
Установите ffmpeg.
Запустите pip install -r require.txt, чтобы установить оставшиеся необходимые пакеты.
Установите webrtcvad pip, установите webrtcvad-wheels.