data_driven_ai_voice_cloning Download - data_driven_ai_voice

Deutsch

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Startseite>Programmierbezogen>Anderer Quellcode

data_driven_ai_voice_cloning

Anderer Quellcode

1.0.0

Herunterladen

Datengesteuertes KI-Stimmenklonen

Dieses Repository ist eine Implementierung des Hauptteils meiner Masterarbeit in Data Science & Engineering. Es ist in zwei Teile gegliedert:

Lautsprecher-Encoder

Modelle: ECAPA-TDNN, Wavlm-Serie
Daten: VoxCeleb1, privater Datensatz

Text-zu-Sprache

Modell: FastSpeech2 (Microsoft-Implementierung)
Daten: LibriTTS

Diese beiden Teile werden dann integriert, um ein Multi-Speaker-Text-to-Speech-Modell zu erhalten, das in der Lage ist, unsichtbare Stimmen ab etwa 5 Sekunden Audio zu klonen, das ZeroShotFastSpeech2-Modell.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2024-12-05
Größe 262.66MB
Kommt von Github

Ähnliche Anwendungen

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
Experimental_data_processing

2024-11-02
nextcloud_share_url_downloader

2024-11-01
flutter_voice_friend

2024-11-01

data_driven_ai_voice_cloning

Datengesteuertes KI-Stimmenklonen

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

zkwork_aleo_gpu_worker

Experimental_data_processing

nextcloud_share_url_downloader

flutter_voice_friend

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

wp functions

termwind