تنزيل ai voice cloning - تنزيل كود المصدر ai voice cloning

ai voice cloning

شفرة المصدر الأخرى

v3.0

تنزيل

استنساخ الصوت بالذكاء الاصطناعي

لاحظ أنني لا أخطط للعمل بنشاط على التحسينات/التحسينات لهذا المشروع، وهذا يهدف بشكل أساسي إلى الحفاظ على الريبو في حالة العمل في حالة تعطل git.ecker الأصلي أو الحاجة إلى إجراء تغييرات الحزمة الضرورية.

ومع ذلك، تمت إضافة بعض التحسينات مقارنة بالريبو الأصلي:

✔️ إمكانية التدرب على لغات أخرى

✔️ تمت إضافة هيفيجان، مما يسمح بالاستدلال بشكل أسرع على حساب الجودة.

✔️ تمت إضافة Whisper-v3 كخيار يمكن اختياره لـ Whisperx

✔️ تحويل الإخراج باستخدام RVC

هذه نسخة فرعية من الريبو الموجود أصلاً هنا: https://git.ecker.tech/mrq/ai-voice-cloning. كل العمل الذي تم وضعه لدمج التدريب مع DLAS والاستدلال باستخدام Tortoise ينتمي إلى mrq، مؤلف النسخة الأصلية لاستنساخ الصوت بالذكاء الاصطناعي.

يثبت

يعمل هذا الريبو على نظام التشغيل Windows مع وحدات معالجة الرسومات NVIDIA و Linux الذي يقوم بتشغيل Docker مع وحدات معالجة الرسومات NVIDIA .

حزمة Windows (مستحسن)

اختياري، ولكن يوصى به: قم بتثبيت 7zip على جهاز الكمبيوتر الخاص بك: https://www.7-zip.org/
- إذا واجهت أي مشكلات في الاستخراج، فمن المرجح أن يرجع ذلك إلى أن برنامج 7zip الخاص بك قديم أو أنك تستخدم مستخرجًا مختلفًا.
توجه إلى علامة تبويب الإصدارات وقم بتنزيل أحدث حزمة على Hugging Face: https://github.com/JarodMica/ai-voice-cloning/releases/tag/v3.0
قم باستخراج أرشيف 7zip.
افتح ai-voice-cloning ثم قم بتشغيل start.bat

التثبيت اليدوي البديل

إذا كنت تقوم بتثبيت هذا يدويًا، فستحتاج إلى:

بايثون 3.11: https://www.python.org/downloads/release/python-311/
البوابة: https://www.git-scm.com/downloads

استنساخ المستودع

 git clone https://github.com/JarodMica/ai-voice-cloning.git

قم بتشغيل ملف setup-cuda.bat وسيبدأ تشغيله عبر جميع حزم python المطلوبة
- إذا لم يكن لديك python 3.11، فلن يعمل وسيتعين عليك تنزيله
بعد الانتهاء، قم بتشغيل start.bat وسيبدأ هذا في تنزيل معظم النماذج التي ستحتاج إليها.
- يتم تنزيل بعض النماذج عند استخدامها لأول مرة. ستتحمل تنزيلات إضافية أثناء الإنشاء وأثناء التدريب (للهمس). ومع ذلك، بمجرد الانتهاء منها، لن تضطر إلى تنزيلها مرة أخرى طالما لم تقم بحذفها. وهي موجودة في مجلد models في الجذر.
(اختياري) يمكنك اختيار تثبيت whisperx للتدريب عن طريق تشغيل setup-whipserx.bat
- قم بمراجعة صفحة Whisperx github لمزيد من التفاصيل، ولكنها أسرع بكثير بالنسبة للملفات الصوتية الأطول. إذا كنت تقوم بمعالجة واحدة تلو الأخرى باستخدام مجموعة بيانات مقسمة بالفعل، فلن يؤدي ذلك إلى تحسين السرعات كثيرًا.

عامل ميناء لنظام التشغيل Linux (أو WSL2)

إعداد خاص بنظام التشغيل Linux

تأكد من تثبيت أحدث برامج تشغيل nvidia: sudo ubuntu-drivers install
قم بتثبيت Docker بالطريقة المفضلة لديك. إحدى طرق القيام بذلك هي اتباع الوثائق الرسمية هنا.
- ابدأ بإلغاء تثبيت الإصدارات القديمة
- اتبع طريقة تثبيت المستودع "apt".
- تأكد من أن كل شيء يعمل مع حاوية "hello-world".
إذا ظهرت لديك رسالة خطأ، عند تشغيل عامل إرساء استنساخ الصوت، تفيد بأنه لا يمكن استخدام وحدة معالجة الرسومات، فقد يتعين عليك تثبيت Nvidia Docker Container Toolkit.
- التثبيت باستخدام الطريقة "apt".
- قم بتشغيل أمر تكوين عامل الإرساء
  sudo nvidia-ctk runtime configure --runtime=docker
- أعد تشغيل عامل الإرساء

إعداد خاص لنظام التشغيل Windows

تأكد من تحديث برامج تشغيل Nvidia لديك: https://www.nvidia.com/download/index.aspx

قم بتثبيت WSL2 في PowerShell باستخدام wsl --install وإعادة التشغيل
افتح PowerShell، واكتب وأدخل ubuntu . يجب الآن تحميلك إلى wsl2
قم بإزالة مفتاح ذاكرة التخزين المؤقت الأصلي لـ nvidia: sudo apt-key del 7fa2af80
تنزيل حلقة مفاتيح مجموعة أدوات CUDA: wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
تثبيت حلقة المفاتيح: sudo dpkg -i cuda-keyring_1.1-1_all.deb
تحديث قائمة الحزم: sudo apt-get update
تثبيت مجموعة أدوات CUDA: sudo apt-get -y install cuda-toolkit-12-4
قم بتثبيت Docker Desktop باستخدام WSL2 كواجهة خلفية
إعادة تشغيل
إذا كنت ترغب في مراقبة الجهاز عن بعد عبر SSH، فاتبع هذا الدليل.
افتح PowerShell، واكتب ubuntu ، ثم اتبع ما يلي

البناء والتشغيل في دوكر

افتح محطة (أو Ubuntu WSL)
استنساخ المستودع: git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
أنشئ الصورة باستخدام ./setup-docker.sh
ابدأ الحاوية باستخدام ./start-docker.sh
قم بزيارة http://localhost:7860 أو عن بعد باستخدام http://<ip>:7860

إذا تعذر الوصول إلى الخادم البعيد، راجع هذا الموضوع

قد تحتاج أيضًا إلى إعادة تعيين مجلداتك المحلية إلى مجلدات Docker. للقيام بذلك، يجب عليك فتح البرنامج النصي "start-docker.sh"، وتحديث بعض الأسطر. على سبيل المثال، إذا كنت تريد العثور على التسجيلات الصوتية التي تم إنشاؤها بسهولة، فقم بإنشاء مجلد "النتائج" في الدليل الجذر، ثم في "start-docker.sh" أضف السطر:

-v "your/custom/path:/home/user/ai-voice-cloning/results"

تعليمات

تحقق من فيديو يوتيوب:

شاهد أولا: https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf

شاهد الثانية (تحديث RVC): https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s

كل شيء يشبه إلى حد كبير ما كان عليه من قبل إذا كنت قد استخدمت هذا المستودع في الماضي، ومع ذلك، هناك خيار جديد لتحويل مخرجات النص باستخدام rvc . قبل أن تتمكن من استخدامه، ستحتاج إلى ملف RVC .pth مدرب تحصل عليه من RVC أو عبر الإنترنت، ثم ستحتاج إلى وضعه في models/rvc_models/ . يمكن وضع كلا الملفين .index و .pth هنا وسيظهران بشكل صحيح في القوائم المنسدلة الخاصة بهما.

لتمكين RVC:

قم بتحديد وتمكين Show Experimental Settings للكشف عن المزيد من الخيارات
تحقق وقم بتمكين Run the outputter audio through RVC . سيكون لديك الآن إمكانية الوصول إلى المعلمات التي يمكنك ضبطها في RVC لنموذج صوت RVC الذي تستخدمه.

تحديث التثبيت الخاص بك

فيما يلي كيفية تحديث الحزمة للحصول على آخر التحديثات

ويندوز

ملاحظة: إذا كان هناك تغيير كبير في الميزات، فتحقق من الإصدار الأخير لمعرفة ما إذا كان update_package.bat سيعمل أم لا. إذا لم يكن الأمر كذلك، فستحتاج إلى إعادة تنزيل الحزمة وإعادة استخراجها من Hugging Face.

قم بتشغيل الملف update_package.bat
- سيتم استنساخ الريبو ونسخ مجلد src من الريبو إلى الحزمة.

التثبيت اليدوي البديل

يجب أن تكون قادرًا على الانتقال إلى المجلد ثم سحب الريبو لتحديثه.

 cd ai-voice-cloning
git pull

إذا تمت إضافة ميزات كبيرة، فقد تحتاج إلى حذف venv وإعادة تشغيل البرنامج النصي setup-cuda للتأكد من عدم وجود مشكلات في الحزمة

لينكس عبر دوكر

يجب أن تكون قادرًا على التنقل داخل المجلد ثم سحب الريبو لتحديثه، ثم إعادة إنشاء صورة Docker الخاصة بك.

 cd ai-voice-cloning
git pull
./setup-docker.sh

التوثيق

استكشاف أخطاء التثبيت اليدوي وإصلاحها

المحطة هي صديقك. ستظهر أي أخطاء أو مشكلات في الجهاز عندما تحاول التشغيل، وبعد ذلك يمكنك البدء في تصحيح الأخطاء من هناك.

إذا حدث عطل في الشعلة في مكان ما أثناء العملية، فقد تضطر إلى إعادة تثبيتها. سيتعين عليك إلغاء تثبيته، ثم إعادة تثبيته كما يلي. تأكد من كتابة (Y) لتأكيد الحذف.

 .venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

الإبلاغ عن الأخطاء

إذا واجهت أي مشاكل، يرجى فتح قضية جديدة في علامة التبويب "القضايا".

نصائح للمطورين

يجب أن يحتوي setup-cuda.bat على كل ما تحتاجه لتثبيت الحزم. جميع ملفات المتطلبات المختلفة تجعل الأمر في حالة فوضى كبيرة في البرنامج النصي، ولكن كل ريبو لديه متطلباته مثبتة، ثم في النهاية، هناك حاجة إلى ملف requirements.txt في الجذر لتغيير الإصدار مرة أخرى إلى الإصدارات المتوافقة لهذا الريبو.

يوسع

معلومات إضافية

الإصدار v3.0
النوع شفرة المصدر الأخرى
وقت التحديث 2024-12-30
الحجم 17.38MB
من Github

تطبيقات ذات صلة

GLM 4 Voice

2024-11-02
Retrieval based Voice Conversion WebUI

2024-11-01
منظمة العفو الدولية الخالق

2023-04-23
جاسبر منظمة العفو الدولية

2023-04-12
الذكاء الاصطناعي الفضائي

2022-07-29
GOOGLE VOICE واجهة SMS غير محدودة

2009-11-07

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل