อังกฤษ | 简体中文 | โปรตุเกส | ภาษาญี่ปุ่น | เกาหลี
Codebase นี้และทุกรุ่นเผยแพร่ภายใต้ใบอนุญาต CC-BY-NC-SA-4.0 โปรดดูใบอนุญาตสำหรับรายละเอียดเพิ่มเติม
Zero-shot & Few-shot TTS: ป้อนตัวอย่างเสียงร้อง 10 ถึง 30 วินาทีเพื่อสร้างเอาต์พุต TTS คุณภาพสูง สำหรับคำแนะนำโดยละเอียด โปรดดูแนวทางปฏิบัติที่ดีที่สุดในการโคลนเสียง
การสนับสนุนหลายภาษาและข้ามภาษา: เพียงคัดลอกและวางข้อความหลายภาษาลงในช่องป้อนข้อมูล โดยไม่ต้องกังวลเรื่องภาษา ปัจจุบันรองรับภาษาอังกฤษ ญี่ปุ่น เกาหลี จีน ฝรั่งเศส เยอรมัน อาหรับ และสเปน
ไม่มีการพึ่งพาหน่วยเสียง: โมเดลนี้มีความสามารถในการวางนัยทั่วไปที่แข็งแกร่ง และไม่ต้องพึ่งพาหน่วยเสียงสำหรับ TTS สามารถจัดการข้อความในสคริปต์ภาษาใดก็ได้
แม่นยำสูง: ได้ CER (อัตราข้อผิดพลาดของอักขระ) และ WER (อัตราข้อผิดพลาดของคำ) ต่ำประมาณ 2% สำหรับข้อความภาษาอังกฤษความยาว 5 นาที
รวดเร็ว: ด้วยการเร่งความเร็วของเทคโนโลยีปลา ปัจจัยแบบเรียลไทม์จะอยู่ที่ประมาณ 1:5 บนแล็ปท็อป Nvidia RTX 4060 และ 1:15 บน Nvidia RTX 4090
การอนุมาน WebUI: นำเสนอ UI เว็บที่ใช้ Gradio ที่ใช้งานง่ายซึ่งเข้ากันได้กับ Chrome, Firefox, Edge และเบราว์เซอร์อื่น ๆ
การอนุมาน GUI: นำเสนออินเทอร์เฟซแบบกราฟิก PyQt6 ที่ทำงานได้อย่างราบรื่นกับเซิร์ฟเวอร์ API รองรับ Linux, Windows และ macOS ดู GUI
ปรับใช้ได้ง่าย: ตั้งค่าเซิร์ฟเวอร์อนุมานได้อย่างง่ายดายด้วยการสนับสนุนดั้งเดิมสำหรับ Linux, Windows และ MacOS ช่วยลดการสูญเสียความเร็ว
เราไม่รับผิดชอบต่อการใช้ codebase ที่ผิดกฎหมาย โปรดดูกฎหมายท้องถิ่นของคุณเกี่ยวกับ DMCA และกฎหมายอื่น ๆ ที่เกี่ยวข้อง
เสียงปลา
การอนุมาน.ipynb
ภาษาอังกฤษ
中文
日本語
โปรตุเกส (บราซิล)
ภาษาอังกฤษ
中文
日本語
โปรตุเกส (บราซิล)
VITS2 (ดาเนียลร็อบนิคอฟ)
เบิร์ต-วิทส์2
GPT VITS
MQTTS
GPT รวดเร็ว
GPT-SoVITS
ผู้สนับสนุนการประมวลผลข้อมูลโดย 6Block
Fish Audio ให้บริการบน Lepton.AI