หมายเหตุ ฉันไม่ได้วางแผนที่จะทำงานอย่างแข็งขันในการปรับปรุง/ปรับปรุงสำหรับโปรเจ็กต์นี้ โดยมีจุดประสงค์หลักเพื่อให้ repo อยู่ในสถานะทำงานในกรณีที่ git.ecker ดั้งเดิมหยุดทำงานหรือจำเป็นต้องทำการเปลี่ยนแปลงแพ็คเกจที่จำเป็น
ดังที่กล่าวไปแล้ว มีการปรับปรุงบางอย่างที่เพิ่มเข้ามาเมื่อเปรียบเทียบกับ repo ดั้งเดิม:
✔️สามารถฝึกภาษาอื่นได้
✔️เพิ่ม Hifigan ช่วยให้อนุมานได้เร็วขึ้นแต่ต้องแลกกับคุณภาพ
✔️ เพิ่ม Whisper-v3 เป็นตัวเลือกที่สามารถเลือกได้สำหรับ Whisperx
✔️การแปลงเอาต์พุตโดยใช้ RVC
นี่คือทางแยกของ repo ที่เดิมอยู่ที่นี่: https://git.ecker.tech/mrq/ai-voice-cloning งานทั้งหมดที่นำไปใช้เพื่อผสมผสานการฝึกอบรมกับ DLAS และการอนุมานกับ Tortoise เป็นของ mrq ผู้เขียน repo ai-voice-cloning ดั้งเดิม
repo นี้ทำงานบน Windows ด้วย NVIDIA GPU และ Linux ที่ใช้ Docker พร้อม NVIDIA GPU
start.bat
หากคุณกำลังติดตั้งด้วยตนเอง คุณจะต้อง:
git clone https://github.com/JarodMica/ai-voice-cloning.git
setup-cuda.bat
และไฟล์จะเริ่มทำงานผ่านแพ็คเกจ Python ทั้งหมดที่จำเป็นstart.bat
และจะเริ่มดาวน์โหลดโมเดลส่วนใหญ่ที่คุณต้องการmodels
ของรูทsetup-whipserx.bat
ตรวจสอบให้แน่ใจว่าได้ติดตั้งไดรเวอร์ NVIDIA ล่าสุดแล้ว: sudo ubuntu-drivers install
ติดตั้ง Docker ตามที่คุณต้องการ วิธีหนึ่งที่ทำได้คือปฏิบัติตามเอกสารอย่างเป็นทางการที่นี่
หากเมื่อเปิดใช้งาน Voice Cloning Docker คุณมีข้อความแสดงข้อผิดพลาดแจ้งว่าไม่สามารถใช้ GPU ได้ คุณอาจต้องติดตั้ง Nvidia Docker Container Toolkit
ติดตั้งด้วยวิธี "apt"
รันคำสั่งการกำหนดค่านักเทียบท่า
sudo nvidia-ctk runtime configure --runtime=docker
รีสตาร์ทนักเทียบท่า
ตรวจสอบให้แน่ใจว่าไดรเวอร์ Nvidia ของคุณทันสมัย: https://www.nvidia.com/download/index.aspx
wsl --install
และรีสตาร์ทubuntu
ตอนนี้มันควรจะโหลดคุณเข้าสู่ wsl2sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4
ubuntu
จากนั้นทำตามด้านล่าง git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
./setup-docker.sh
./start-docker.sh
http://localhost:7860
หรือระยะไกลด้วย http://<ip>:7860
หากไม่สามารถเข้าถึงเซิร์ฟเวอร์ระยะไกลได้ ให้ชำระเงินในกระทู้นี้
คุณอาจต้องทำการแมปโฟลเดอร์ในเครื่องของคุณใหม่ไปยังโฟลเดอร์ Docker ในการดำเนินการนี้ คุณต้องเปิดสคริปต์ "start-docker.sh" และอัปเดตบางบรรทัด ตัวอย่างเช่น หากคุณต้องการค้นหาไฟล์เสียงที่คุณสร้างขึ้นอย่างง่ายดาย ให้สร้างโฟลเดอร์ "results" ในไดเรกทอรีราก จากนั้นใน "start-docker.sh" ให้เพิ่มบรรทัด:
-v "your/custom/path:/home/user/ai-voice-cloning/results"
ชำระเงินวิดีโอ YouTube:
ดูก่อน: https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf
ดูวินาที (อัปเดต RVC): https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s
ทุกอย่างจะค่อนข้างเหมือนเดิมหากคุณเคยใช้พื้นที่เก็บข้อมูลนี้ในอดีต อย่างไรก็ตาม มีตัวเลือกใหม่ในการแปลงเอาต์พุตข้อความโดยใช้ rvc
ก่อนที่คุณจะสามารถใช้งานได้ คุณจะต้องมีไฟล์ RVC .pth ที่ผ่านการฝึกอบรม ซึ่งคุณได้รับจาก RVC หรือออนไลน์ จากนั้นคุณจะต้องวางไฟล์ไว้ใน models/rvc_models/
สามารถวางทั้งไฟล์ .index และ .pth ได้ที่นี่ และจะแสดงอย่างถูกต้องในเมนูแบบเลื่อนลงตามลำดับ
หากต้องการเปิดใช้งาน rvc:
Show Experimental Settings
เพื่อแสดงตัวเลือกเพิ่มเติมRun the outputter audio through RVC
ตอนนี้คุณจะสามารถเข้าถึงพารามิเตอร์ที่คุณสามารถปรับเปลี่ยนใน RVC สำหรับโมเดลเสียง RVC ที่คุณใช้อยู่ ด้านล่างนี้เป็นวิธีที่คุณสามารถอัปเดตแพ็คเกจสำหรับการอัพเดตล่าสุด
หมายเหตุ: หากมีการเปลี่ยนแปลงคุณสมบัติที่สำคัญ ให้ตรวจสอบรุ่นล่าสุดเพื่อดูว่า
update_package.bat
จะทำงานหรือไม่ ถ้าไม่ คุณจะต้องดาวน์โหลดใหม่และแตกแพ็คเกจออกจาก Hugging Face ใหม่
update_package.bat
คุณควรจะสามารถนำทางไปยังโฟลเดอร์แล้วดึง repo เพื่ออัปเดตได้
cd ai-voice-cloning
git pull
หากมีการเพิ่มคุณสมบัติขนาดใหญ่ คุณอาจต้องลบ venv และรันสคริปต์ setup-cuda อีกครั้งเพื่อให้แน่ใจว่าไม่มีปัญหาเกี่ยวกับแพ็คเกจ
คุณควรจะสามารถนำทางไปยังโฟลเดอร์ได้ จากนั้นดึง repo เพื่ออัปเดต จากนั้นสร้างอิมเมจ Docker ของคุณขึ้นมาใหม่
cd ai-voice-cloning
git pull
./setup-docker.sh
อาคารผู้โดยสารคือเพื่อนของคุณ ข้อผิดพลาดหรือปัญหาใดๆ จะปรากฏขึ้นในเทอร์มินัลเมื่อคุณลองและเรียกใช้ จากนั้นคุณก็สามารถเริ่มแก้ไขจุดบกพร่องได้จากที่นั่น
.venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
หากคุณประสบปัญหาใดๆ โปรดเปิดปัญหาใหม่บนแท็บปัญหา
setup-cuda.bat
ควรมีทุกสิ่งที่คุณต้องการสำหรับการติดตั้งแพ็คเกจ ไฟล์ข้อกำหนดที่แตกต่างกันทั้งหมดทำให้สคริปต์ค่อนข้างยุ่งเหยิง แต่ repo แต่ละไฟล์มีข้อกำหนดที่ติดตั้งไว้ และในตอนท้าย จำเป็นต้องมีไฟล์ requirements.txt
ในรูทเพื่อเปลี่ยนเวอร์ชัน กลับ เป็นเวอร์ชันที่เข้ากันได้สำหรับ repo นี้