MockingBird คือระบบ AI สร้างคำเลียนเสียงธรรมชาติที่สามารถโคลนเสียงของคุณและสร้างเนื้อหาคำพูดได้ตามใจชอบ
ลักษณะเฉพาะ
1. ข้อความรองรับภาษาจีนกลางและได้รับการทดสอบโดยใช้ชุดข้อมูลภาษาจีนที่หลากหลาย: aidadatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell ฯลฯ
2. PyTorch เหมาะกับ pytorch ทดสอบแล้วใน 1.9.0 (ล่าสุดเดือนสิงหาคม 2021), GPU Tesla T4 และ GTX 2060
3. Windows + Linux สามารถทำงานในระบบปฏิบัติการ Windows และระบบปฏิบัติการ Linux (ระบบ Apple รุ่น M1 ก็มีกรณีการดำเนินงานชุมชนประสบความสำเร็จเช่นกัน)
4. ง่ายและยอดเยี่ยม เพียงดาวน์โหลดหรือฝึกซินธิไซเซอร์ (ซินธิไซเซอร์) ใหม่เพื่อให้ได้ผลลัพธ์ที่ดี ใช้ตัวเข้ารหัส/โวโคเดอร์ที่ได้รับการฝึกมาแล้วซ้ำ หรือ HiFi-GAN แบบเรียลไทม์เป็นโวโคเดอร์
5. Webserver Ready สามารถแสดงผลการฝึกอบรมสำหรับการโทรระยะไกลได้
เริ่ม
ข้อกำหนดในการติดตั้ง
ปฏิบัติตามพื้นที่เก็บข้อมูลดั้งเดิมเพื่อทดสอบว่าคุณมีสภาพแวดล้อมทั้งหมดพร้อมแล้วหรือไม่ ต้องใช้ Python 3.7 หรือสูงกว่าเพื่อเรียกใช้กล่องเครื่องมือ
ติดตั้ง PyTorch
หากข้อผิดพลาด: ไม่พบเวอร์ชันที่ตรงตามข้อกำหนด torch==1.9.0+cu102 (จากเวอร์ชัน: 0.1.2, 0.1.2.post1, 0.1.2.post2) เกิดขึ้นเมื่อติดตั้งด้วย pip อาจเป็นได้ว่า python ต่ำเกินไป สามารถติดตั้ง 3.9 ได้สำเร็จ
ติดตั้ง ffmpeg.
รัน pip install -r needs.txt เพื่อติดตั้งแพ็คเกจที่จำเป็นที่เหลืออยู่
ติดตั้ง webrtcvad pip ติดตั้ง webrtcvad-wheels