Bahasa Inggris |
Awesome-Chattts adalah proyek ringkasan sumber daya Chattts yang direkomendasikan secara resmi.
Jika menurut Anda proyek ini bermanfaat bagi Anda untuk memahami dan menggunakan Chattts, beri saya hadiah dan dukungan.
Catatan
Proyek -proyek berikut adalah sumber daya masyarakat.
Situs web | jenis |
---|---|
Web Asli | Pengalaman versi web asli |
Forge Web | Pengalaman Edisi Peningkatan Edisi |
Linux | Paket Instalasi Python |
Sampel | Contoh biji nada |
Kloning | Pengalaman kloning nada |
proyek | Bintang | Highlight |
---|---|---|
jianchang512/chattts-ui | Menyediakan antarmuka API yang dapat dipanggil dalam aplikasi pihak ketiga | |
6DRF21E/CHATTTS_COLAB | Berikan output streaming, mendukung pembuatan audio yang panjang dan membaca karakter bagian | |
Lenml/Chattts-Forge | Memberikan peningkatan vokal dan pengurangan kebisingan latar belakang, dengan kata -kata cepat tambahan tersedia | |
CCMAHUA/CHATTTS-ENHANCED | Mendukung pemrosesan file dan ekspor file SRT | |
HKOON/CHATTTS-OPENVOICE | Kloning suara dengan OpenVoice |
proyek | Bintang | Highlight |
---|---|---|
6drf21e/chattts_speaker | Evaluasi penandaan karakter dan stabilitas nada | |
AIFSH/COMFYUI-CHATTTS | Versi comfyui, yang dapat diperkenalkan sebagai node alur kerja | |
MaterialShadow/Chattts-Manager | Menyediakan sistem manajemen nada dan antarmuka webui |
Setelah pengujian yang sebenarnya, ada perbedaan yang signifikan dalam efek menghasilkan spk_emb
setiap kali nilai benih nada yang ditentukan dihasilkan dan menggunakan kembali spk_emb
.pt
telah dihasilkan sebelumnya.
Biji nada awalnya ditandai dan evaluasi stabil dalam proyek Chattts_speaker, dan nada yang tepat dapat dipilih dengan cepat melalui contoh.
Saat digunakan dalam WebUI resmi, Anda dapat secara langsung menyalin kode nada dan mengganti nilainya di 9. Speaker Embedding
untuk mencapai kontrol nada.
Ketika digunakan dalam skrip Python, lihat skema kompresi dalam edisi#07 untuk mencapai kontrol nada.
spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )
params_infer_code = ChatTTS . Chat . InferCodeParams (
spk_emb = spk_emb_str , # add sampled speaker
temperature = .0003 , # using custom temperature
top_P = 0.7 , # top P decode
top_K = 20 , # top K decode
)
video | Highlight |
---|---|
Saudara Tongji Zihao | Tutorial Penerapan Detail Dari Masuk ke Advanced |
Ztfs | Tutorial Penyebaran Mac M1 |
King - Bao Bao | Tutorial Penerapan Windows |
video | Highlight |
---|---|
Sam Witteveen | Pengantar versi bahasa Inggris |
Setelah iterasi baru -baru ini, masalah dalam kode repositori sumber pada dasarnya telah diselesaikan. Jika Anda mengalami masalah, disarankan untuk memeriksa versi Cina dari dokumen deskripsi resmi secara detail terlebih dahulu.
Proyek asli perlu mengunduh model yang sesuai dari Huggingface. Sebagai alternatif, Anda dapat mengunduh model dan konfigurasi dari Modelscope dan mengkonfigurasi jalur lokal.
Penting
Perpustakaan Model di Menara Magic dikelola oleh sukarelawan dan tidak menjamin bahwa semua model terbaru.
pip install modelscope
# 在开头导入依赖,并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )
# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )
Saat berjalan di IDE, skrip tidak dapat berjalan dengan lancar karena jalur relatif file.
Dianjurkan untuk merujuk pada instruksi di startup cepat dokumentasi resmi dan menjalankannya langsung di terminal.
Pastikan Anda berada di direktori Root Proyek saat menjalankan perintah berikut.
python examples/web/webui.py
Audio yang dihasilkan akan disimpan ke
./output_audio_n.mp3
python examples/cmd/run.py " Your text 1. " " Your text 2. "
Masalah ini terjadi karena kode resmi tidak mencakup sepanjang waktu ketika berhadapan dengan tanda baca Cina, misalnya ?
Simbol seperti, …
tidak diproses, menghasilkan kesalahan selama pembuatan model.
Anda dapat secara manual menghapus tanda baca Cina yang serupa, atau memodifikasi kode dalam ChatTTS/utils/infer_utils.py
untuk menambahkan tanda baca yang hilang ke kamus character_map
pada baris 103.
character_map = {
'…' : '' ,
'—' : ',' ,
'_' : ',' ,
'?' : ',' ,
}
GPU membutuhkan setidaknya memori video 4G, jika tidak CPU akan digunakan.
1. load_models() got an unexpected keyword argument 'source'
Lihat FAQ untuk detailnya - model tidak dapat diunduh
2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'
Lihat FAQ untuk detailnya - model tidak dapat diunduh
3. FileNotFoundError:[Erzno 2] No such file or directory: 'C:\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots
Lihat FAQ untuk detailnya - model tidak dapat diunduh
4. local variable 'Normalizer' referenced before assignment
Anda perlu menginstal dependensi pynini
dan WeTextProcessing
setelah menyelesaikan konfigurasi lingkungan.
conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing
5. download to Local path D:pythonlprojectChatTTSChatTTS failed.
Jalankan skrip secara langsung di IDE , dan kesalahan akan dilaporkan karena masalah jalur file.
6. ModuleNotFoundError : No module named'Cython'
Jalur eksekusi Python tidak ditemukan, perangkat Windows perlu mengkonfigurasi jalur lingkungan sesuai dengan tutorial