لاحظ أنني لا أخطط للعمل بنشاط على التحسينات/التحسينات لهذا المشروع، وهذا يهدف بشكل أساسي إلى الحفاظ على الريبو في حالة العمل في حالة تعطل git.ecker الأصلي أو الحاجة إلى إجراء تغييرات الحزمة الضرورية.
ومع ذلك، تمت إضافة بعض التحسينات مقارنة بالريبو الأصلي:
✔️ إمكانية التدرب على لغات أخرى
✔️ تمت إضافة هيفيجان، مما يسمح بالاستدلال بشكل أسرع على حساب الجودة.
✔️ تمت إضافة Whisper-v3 كخيار يمكن اختياره لـ Whisperx
✔️ تحويل الإخراج باستخدام RVC
هذه نسخة فرعية من الريبو الموجود أصلاً هنا: https://git.ecker.tech/mrq/ai-voice-cloning. كل العمل الذي تم وضعه لدمج التدريب مع DLAS والاستدلال باستخدام Tortoise ينتمي إلى mrq، مؤلف النسخة الأصلية لاستنساخ الصوت بالذكاء الاصطناعي.
يعمل هذا الريبو على نظام التشغيل Windows مع وحدات معالجة الرسومات NVIDIA و Linux الذي يقوم بتشغيل Docker مع وحدات معالجة الرسومات NVIDIA .
start.bat
إذا كنت تقوم بتثبيت هذا يدويًا، فستحتاج إلى:
git clone https://github.com/JarodMica/ai-voice-cloning.git
setup-cuda.bat
وسيبدأ تشغيله عبر جميع حزم python المطلوبةstart.bat
وسيبدأ هذا في تنزيل معظم النماذج التي ستحتاج إليها.models
في الجذر.setup-whipserx.bat
تأكد من تثبيت أحدث برامج تشغيل nvidia: sudo ubuntu-drivers install
قم بتثبيت Docker بالطريقة المفضلة لديك. إحدى طرق القيام بذلك هي اتباع الوثائق الرسمية هنا.
إذا ظهرت لديك رسالة خطأ، عند تشغيل عامل إرساء استنساخ الصوت، تفيد بأنه لا يمكن استخدام وحدة معالجة الرسومات، فقد يتعين عليك تثبيت Nvidia Docker Container Toolkit.
التثبيت باستخدام الطريقة "apt".
قم بتشغيل أمر تكوين عامل الإرساء
sudo nvidia-ctk runtime configure --runtime=docker
أعد تشغيل عامل الإرساء
تأكد من تحديث برامج تشغيل Nvidia لديك: https://www.nvidia.com/download/index.aspx
wsl --install
وإعادة التشغيلubuntu
. يجب الآن تحميلك إلى wsl2sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4
ubuntu
، ثم اتبع ما يلي git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
./setup-docker.sh
./start-docker.sh
http://localhost:7860
أو عن بعد باستخدام http://<ip>:7860
إذا تعذر الوصول إلى الخادم البعيد، راجع هذا الموضوع
قد تحتاج أيضًا إلى إعادة تعيين مجلداتك المحلية إلى مجلدات Docker. للقيام بذلك، يجب عليك فتح البرنامج النصي "start-docker.sh"، وتحديث بعض الأسطر. على سبيل المثال، إذا كنت تريد العثور على التسجيلات الصوتية التي تم إنشاؤها بسهولة، فقم بإنشاء مجلد "النتائج" في الدليل الجذر، ثم في "start-docker.sh" أضف السطر:
-v "your/custom/path:/home/user/ai-voice-cloning/results"
تحقق من فيديو يوتيوب:
شاهد أولا: https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf
شاهد الثانية (تحديث RVC): https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s
كل شيء يشبه إلى حد كبير ما كان عليه من قبل إذا كنت قد استخدمت هذا المستودع في الماضي، ومع ذلك، هناك خيار جديد لتحويل مخرجات النص باستخدام rvc
. قبل أن تتمكن من استخدامه، ستحتاج إلى ملف RVC .pth مدرب تحصل عليه من RVC أو عبر الإنترنت، ثم ستحتاج إلى وضعه في models/rvc_models/
. يمكن وضع كلا الملفين .index و .pth هنا وسيظهران بشكل صحيح في القوائم المنسدلة الخاصة بهما.
لتمكين RVC:
Show Experimental Settings
للكشف عن المزيد من الخياراتRun the outputter audio through RVC
. سيكون لديك الآن إمكانية الوصول إلى المعلمات التي يمكنك ضبطها في RVC لنموذج صوت RVC الذي تستخدمه. فيما يلي كيفية تحديث الحزمة للحصول على آخر التحديثات
ملاحظة: إذا كان هناك تغيير كبير في الميزات، فتحقق من الإصدار الأخير لمعرفة ما إذا كان
update_package.bat
سيعمل أم لا. إذا لم يكن الأمر كذلك، فستحتاج إلى إعادة تنزيل الحزمة وإعادة استخراجها من Hugging Face.
update_package.bat
يجب أن تكون قادرًا على الانتقال إلى المجلد ثم سحب الريبو لتحديثه.
cd ai-voice-cloning
git pull
إذا تمت إضافة ميزات كبيرة، فقد تحتاج إلى حذف venv وإعادة تشغيل البرنامج النصي setup-cuda للتأكد من عدم وجود مشكلات في الحزمة
يجب أن تكون قادرًا على التنقل داخل المجلد ثم سحب الريبو لتحديثه، ثم إعادة إنشاء صورة Docker الخاصة بك.
cd ai-voice-cloning
git pull
./setup-docker.sh
المحطة هي صديقك. ستظهر أي أخطاء أو مشكلات في الجهاز عندما تحاول التشغيل، وبعد ذلك يمكنك البدء في تصحيح الأخطاء من هناك.
.venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
إذا واجهت أي مشاكل، يرجى فتح قضية جديدة في علامة التبويب "القضايا".
يجب أن يحتوي setup-cuda.bat
على كل ما تحتاجه لتثبيت الحزم. جميع ملفات المتطلبات المختلفة تجعل الأمر في حالة فوضى كبيرة في البرنامج النصي، ولكن كل ريبو لديه متطلباته مثبتة، ثم في النهاية، هناك حاجة إلى ملف requirements.txt
في الجذر لتغيير الإصدار مرة أخرى إلى الإصدارات المتوافقة لهذا الريبو.