Этот репозиторий представляет собой реализацию трансферного обучения от проверки говорящего к синтезу речи нескольких говорящих (SV2TTS) с вокодером, который работает в режиме реального времени. Это была моя магистерская диссертация.
SV2TTS — это трехэтапная структура глубокого обучения. На первом этапе из нескольких секунд аудио создается цифровое представление голоса. На втором и третьем этапах это представление используется в качестве ссылки для генерации речи по произвольному тексту.
Видеодемонстрация (нажмите на картинку):
URL-адрес | Обозначение | Заголовок | Источник реализации |
---|---|---|---|
1806.04558 | СВ2ТТС | Перенос обучения от проверки говорящего к синтезу речи с участием нескольких говорящих | Это репо |
1802.08435 | WaveRNN (вокодер) | Эффективный нейронный синтез звука | фаткорд/WaveRNN |
1703.10135 | Такотрон (синтезатор) | Tacotron: к сквозному синтезу речи | фаткорд/WaveRNN |
1710.10467 | GE2E (энкодер) | Обобщенные сквозные потери при проверке говорящего | Это репо |
Как и все остальное в глубоком обучении, это репозиторий быстро устарело. Многие приложения SaaS (часто платные) обеспечат лучшее качество звука, чем этот репозиторий. Если вам нужно решение с открытым исходным кодом и высоким качеством передачи голоса:
venv
, но это необязательно.pip install -r requirements.txt
Предварительно обученные модели теперь загружаются автоматически. Если вам это не помогло, вы можете скачать их вручную здесь.
Прежде чем загружать какой-либо набор данных, вы можете начать с тестирования своей конфигурации с помощью:
python demo_cli.py
Если все тесты пройдены, можно идти.
Для игры только с набором инструментов я рекомендую скачать только LibriSpeech/train-clean-100
. Извлеките содержимое как
, где
— каталог по вашему выбору. Другие наборы данных поддерживаются в наборе инструментов, см. здесь. Вы можете не загружать какой-либо набор данных, но тогда вам потребуются ваши собственные данные в виде аудиофайлов или вам придется записать их с помощью панели инструментов.
Затем вы можете попробовать набор инструментов:
python demo_toolbox.py -d
или
python demo_toolbox.py
в зависимости от того, загрузили ли вы какие-либо наборы данных. Если вы используете X-сервер или у вас возникла ошибка Aborted (core dumped)
, см. эту проблему.