MockingBird هو نظام محاكاة صوتية يعتمد على الذكاء الاصطناعي يمكنه استنساخ صوتك وإنشاء محتوى كلام عشوائي.
مميزة
1. يدعم النص لغة الماندرين ويتم اختباره باستخدام مجموعة متنوعة من مجموعات البيانات الصينية: aidatatang_200zh، وmagicdata، وaishell3، وbiaobei، وMozillaCommonVoice، وdata_aishell، وما إلى ذلك.
2. PyTorch مناسب لـ pytorch، وقد تم اختباره في الإصدار 1.9.0 (آخر إصدار في أغسطس 2021)، وGPU Tesla T4 وGTX 2060
3. يمكن تشغيل Windows + Linux في نظام التشغيل Windows ونظام التشغيل Linux (يحتوي إصدار نظام Apple M1 أيضًا على حالات تشغيل مجتمعية ناجحة)
4. سهل ورائع، ما عليك سوى تنزيل المُركِّب (المُركِّب) أو تدريبه حديثًا لتحقيق نتائج جيدة، أو إعادة استخدام المشفر/المشفر الصوتي المُدرب مسبقًا، أو HiFi-GAN في الوقت الفعلي كمشفر صوتي
5. يمكن أن يخدم Webserver Ready نتائج التدريب الخاصة بك للاتصال عن بعد
يبدأ
متطلبات التثبيت
اتبع المستودع الأصلي لاختبار ما إذا كانت جميع بيئاتك جاهزة أم لا. مطلوب Python 3.7 أو أعلى لتشغيل صندوق الأدوات.
قم بتثبيت باي تورش.
إذا حدث خطأ: تعذر العثور على إصدار يلبي متطلبات torch==1.9.0+cu102 (من الإصدارات: 0.1.2، 0.1.2.post1، 0.1.2.post2) عند التثبيت باستخدام النقطة، فقد يكون ذلك python منخفض جدًا، ويمكن تثبيت 3.9 بنجاح
قم بتثبيت ffmpeg.
قم بتشغيل pip install -r require.txt لتثبيت الحزم الضرورية المتبقية.
تثبيت webrtcvad pip، تثبيت webrtcvad-wheels.