Repositori ini merupakan implementasi Transfer Learning dari Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS) dengan vocoder yang bekerja secara real-time. Ini adalah tesis master saya.
SV2TTS adalah kerangka pembelajaran mendalam dalam tiga tahap. Pada tahap pertama, seseorang membuat representasi digital dari suara dari audio beberapa detik. Pada tahap kedua dan ketiga, representasi ini digunakan sebagai acuan untuk menghasilkan tuturan yang diberikan teks arbitrer.
Video demonstrasi (klik gambar):
URL | Penamaan | Judul | Sumber implementasi |
---|---|---|---|
1806.04558 | SV2TTS | Mentransfer Pembelajaran dari Verifikasi Speaker ke Sintesis Text-To-Speech Multispeaker | Repo ini |
1802.08435 | WaveRNN (vocoder) | Sintesis Audio Neural yang Efisien | fatchord/WaveRNN |
1703.10135 | Tacotron (penyintesis) | Tacotron: Menuju Sintesis Ucapan Ujung-ke-Ujung | fatchord/WaveRNN |
1710.10467 | GE2E (pengkode) | Kerugian End-To-End yang Umum untuk Verifikasi Pembicara | Repo ini |
Seperti semua hal lainnya di Deep Learning, repo ini dengan cepat menjadi tua. Banyak aplikasi SaaS (seringkali berbayar) akan memberi Anda kualitas audio yang lebih baik daripada repositori ini. Jika Anda menginginkan solusi sumber terbuka dengan kualitas suara tinggi:
venv
, tetapi ini opsional.pip install -r requirements.txt
Model yang telah dilatih sebelumnya kini diunduh secara otomatis. Jika ini tidak berhasil, Anda dapat mengunduhnya secara manual di sini.
Sebelum mendownload kumpulan data apa pun, Anda dapat memulai dengan menguji konfigurasi Anda dengan:
python demo_cli.py
Jika semua tes lulus, Anda siap berangkat.
Untuk bermain dengan toolbox saja, saya hanya menyarankan mengunduh LibriSpeech/train-clean-100
. Ekstrak konten sebagai
dengan
adalah direktori pilihan Anda. Kumpulan data lain didukung di kotak alat, lihat di sini. Anda bebas untuk tidak mengunduh kumpulan data apa pun, tetapi Anda memerlukan data Anda sendiri sebagai file audio atau Anda harus merekamnya dengan kotak peralatan.
Anda kemudian dapat mencoba kotak peralatan:
python demo_toolbox.py -d
atau
python demo_toolbox.py
tergantung pada apakah Anda mengunduh kumpulan data apa pun. Jika Anda menjalankan server X atau jika Anda mengalami kesalahan Aborted (core dumped)
, lihat masalah ini.