data_driven_ai_voice_cloning Загрузка - data_driven_ai_voice_cloning Загрузка исходного кода

data_driven_ai_voice_cloning

Другой исходный код

1.0.0

Скачать

Клонирование голоса с помощью искусственного интеллекта на основе данных

Этот репозиторий представляет собой реализацию основной части моей магистерской диссертации в области науки о данных и инженерии. Он разделен на две части:

Кодер динамика

модели: ECAPA-TDNN, серия wavlm
данные: VoxCeleb1, частный набор данных

Преобразование текста в речь

модель: FastSpeech2 (реализация Microsoft)
данные: ЛибриТТС

Эти две части затем объединяются для создания модели преобразования текста в речь с несколькими динамиками, которая способна клонировать невидимые голоса, начиная примерно с 5 секунд звука, модели ZeroShotFastSpeech2.

Расширять

Дополнительная информация