Catatan Saya tidak berencana untuk secara aktif mengerjakan perbaikan/penyempurnaan untuk proyek ini, hal ini terutama dimaksudkan untuk menjaga repo dalam kondisi berfungsi jika git.ecker asli tidak berfungsi atau perubahan paket yang diperlukan perlu dilakukan.
Meskipun demikian, beberapa peningkatan ditambahkan dibandingkan dengan repo asli:
✔️ Kemungkinan untuk berlatih dalam bahasa lain
✔️ Hifigan menambahkan, memungkinkan inferensi lebih cepat dengan mengorbankan kualitas.
✔️ bisikan-v3 ditambahkan sebagai opsi yang dapat dipilih untuk bisikanx
✔️ Konversi keluaran menggunakan RVC
Ini adalah cabang dari repo yang aslinya terletak di sini: https://git.ecker.tech/mrq/ai-voice-cloning. Semua pekerjaan yang dilakukan untuk menggabungkan pelatihan dengan DLAS dan inferensi dengan Tortoise adalah milik mrq, penulis repo ai-voice-cloning asli.
Repo ini berfungsi di Windows dengan GPU NVIDIA dan Linux yang menjalankan Docker dengan GPU NVIDIA .
start.bat
Jika Anda menginstalnya secara manual, Anda memerlukan:
git clone https://github.com/JarodMica/ai-voice-cloning.git
setup-cuda.bat
dan itu akan mulai menjalankan semua paket python yang diperlukanstart.bat
dan ini akan mulai mengunduh sebagian besar model yang Anda perlukan.models
root.setup-whipserx.bat
Pastikan driver nvidia terbaru sudah terinstal: sudo ubuntu-drivers install
Instal Docker sesuai keinginan Anda. Salah satu cara melakukannya adalah dengan mengikuti dokumentasi resmi di sini.
Jika, saat meluncurkan buruh pelabuhan kloning suara, Anda mendapatkan pesan kesalahan yang mengatakan bahwa GPU tidak dapat digunakan, Anda mungkin harus menginstal Nvidia Docker Container Toolkit.
Instal dengan metode "apt".
Jalankan perintah konfigurasi buruh pelabuhan
sudo nvidia-ctk runtime configure --runtime=docker
Mulai ulang buruh pelabuhan
Pastikan driver Nvidia Anda mutakhir: https://www.nvidia.com/download/index.aspx
wsl --install
dan mulai ulangubuntu
. Sekarang seharusnya memuat Anda ke wsl2sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4
ubuntu
, lalu ikuti di bawah git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
./setup-docker.sh
./start-docker.sh
http://localhost:7860
atau dari jarak jauh dengan http://<ip>:7860
Jika server jarak jauh tidak dapat dijangkau, periksa thread ini
Anda mungkin juga perlu memetakan ulang folder lokal Anda ke folder Docker. Untuk melakukan ini, Anda harus membuka skrip "start-docker.sh", dan memperbarui beberapa baris. Misalnya, jika Anda ingin menemukan audio yang dihasilkan dengan mudah, buat folder "results" di direktori root, lalu di "start-docker.sh" tambahkan baris:
-v "your/custom/path:/home/user/ai-voice-cloning/results"
Lihat video YouTube:
Tonton Dulu: https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf
Tonton Kedua (pembaruan RVC): https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s
Semuanya hampir sama seperti sebelumnya jika Anda pernah menggunakan repositori ini sebelumnya, namun, ada opsi baru untuk mengonversi keluaran teks menggunakan rvc
. Sebelum Anda dapat menggunakannya, Anda memerlukan file .pth RVC terlatih yang Anda dapatkan dari RVC atau online, dan kemudian Anda harus menempatkannya di models/rvc_models/
. File .index dan .pth dapat ditempatkan di sini dan akan ditampilkan dengan benar di menu dropdown masing-masing.
Untuk mengaktifkan rvc:
Show Experimental Settings
untuk menampilkan lebih banyak opsiRun the outputter audio through RVC
. Anda sekarang akan memiliki akses ke parameter yang dapat Anda sesuaikan di RVC untuk model suara RVC yang Anda gunakan. Di bawah ini adalah bagaimana Anda dapat memperbarui paket untuk pembaruan terkini
CATATAN: Jika ada perubahan fitur besar, periksa rilis terbaru untuk melihat apakah
update_package.bat
akan berfungsi. Jika TIDAK, Anda perlu mengunduh ulang dan mengekstrak ulang paket dari Hugging Face.
update_package.bat
Anda seharusnya dapat menavigasi ke dalam folder dan kemudian menarik repo untuk memperbaruinya.
cd ai-voice-cloning
git pull
Jika ada fitur besar yang ditambahkan, Anda mungkin perlu menghapus venv dan menjalankan kembali skrip setup-cuda untuk memastikan tidak ada masalah paket
Anda seharusnya dapat menavigasi ke dalam folder tersebut dan kemudian menarik repo untuk memperbaruinya, lalu membangun kembali image Docker Anda.
cd ai-voice-cloning
git pull
./setup-docker.sh
Terminal adalah teman Anda. Kesalahan atau masalah apa pun akan muncul di terminal saat Anda mencoba dan menjalankannya, lalu Anda dapat mulai melakukan debug dari sana.
.venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
Jika Anda mengalami masalah, silakan buka terbitan baru di tab isu.
setup-cuda.bat
harus memiliki semua yang Anda perlukan untuk menginstal paket. Semua file persyaratan yang berbeda membuatnya cukup berantakan dalam skrip, tetapi setiap repo memiliki persyaratannya yang diinstal, dan pada akhirnya, requirements.txt
di root diperlukan untuk mengubah versi kembali ke versi yang kompatibel untuk repo ini.