Bahasa Inggris | 简体中文 | Portugis | 日本語 | 한국어
Basis kode ini dan semua model dirilis di bawah Lisensi CC-BY-NC-SA-4.0. Silakan merujuk ke LISENSI untuk lebih jelasnya.
TTS Zero-shot & Few-shot: Masukkan sampel vokal 10 hingga 30 detik untuk menghasilkan keluaran TTS berkualitas tinggi. Untuk panduan mendetail, lihat Praktik Terbaik Kloning Suara.
Dukungan Multibahasa & Lintas Bahasa: Cukup salin dan tempel teks multibahasa ke dalam kotak masukan—tidak perlu khawatir tentang bahasanya. Saat ini mendukung bahasa Inggris, Jepang, Korea, Cina, Prancis, Jerman, Arab, dan Spanyol.
Tidak Ada Ketergantungan Fonem: Model ini memiliki kemampuan generalisasi yang kuat dan tidak bergantung pada fonem untuk TTS. Itu dapat menangani teks dalam skrip bahasa apa pun.
Sangat Akurat: Mencapai CER (Tingkat Kesalahan Karakter) dan WER (Tingkat Kesalahan Kata) yang rendah sekitar 2% untuk teks bahasa Inggris berdurasi 5 menit.
Cepat: Dengan akselerasi teknologi ikan, faktor real-time kira-kira 1:5 pada laptop Nvidia RTX 4060 dan 1:15 pada Nvidia RTX 4090.
Inferensi WebUI: Menampilkan UI web berbasis Gradio yang mudah digunakan dan kompatibel dengan Chrome, Firefox, Edge, dan browser lainnya.
Inferensi GUI: Menawarkan antarmuka grafis PyQt6 yang bekerja secara lancar dengan server API. Mendukung Linux, Windows, dan macOS. Lihat GUI.
Ramah Penerapan: Siapkan server inferensi dengan mudah dengan dukungan asli untuk Linux, Windows, dan MacOS, meminimalkan kehilangan kecepatan.
Kami tidak bertanggung jawab atas penggunaan basis kode secara ilegal. Silakan mengacu pada undang-undang setempat Anda tentang DMCA dan undang-undang terkait lainnya.
Audio Ikan
inferensi.ipynb
Bahasa inggris
tidak
日本語
Portugis (Brasil)
Bahasa inggris
tidak
日本語
Portugis (Brasil)
VITS2 (daniilrobnikov)
Bert-VITS2
VITS GPT
MQTTS
GPT Cepat
GPT-SoVITS
Sponsor Pemrosesan Data oleh 6Block
Audio Ikan disajikan di Lepton.AI