تنزيل lip synthesis - تنزيل كود مصدر lip synthesis

lip synthesis

كود الذكاء الاصطناعي

1.0.0

تنزيل

تركيب الشفاه بالصوت والصورة عبر تمثيل معالم وسيطة | مشروع السنة النهائية (أطروحة) لـ Wish Suharitdamrong

هذا هو تطبيق التعليمات البرمجية لمشروع السنة النهائية لـ Wish Suharitdamrong، السنة الثالثة بكالوريوس علوم الكمبيوتر في جامعة ساري حول موضوع تركيب الشفاه الصوتي والمرئي عبر تمثيل المعالم الوسيطة.

نص بديل

تجريبي

العرض التوضيحي عبر الإنترنت متاح في؟ HuggingFace

تثبيت

هناك طريقتان لتثبيت الحزمة باستخدام conda أو pip

1. قم بإنشاء بيئة كوندا افتراضية من environment.yml

2. استخدم النقطة لتثبيت pakages (تأكد من استخدام python 3.7 أو أعلى لأن الإصدار الأقدم قد لا يدعم بعض المكتبات)

استخدم كوندا

 # إنشاء بيئة افتراضية من .yml fileconda env create -f Environment.yml# تفعيل البيئة الافتراضيةcondaactivate fyp

استخدم النقطة

 # استخدم النقطة للتثبيت require packagespip install -r require.txt

مجموعة البيانات

مجموعة البيانات الصوتية والمرئية المستخدمة في هذا المشروع هي LRS2 وLRS3. تم استخدام بيانات LRS2 لكل من التدريب النموذجي والتقييم. تم استخدام بيانات LRS3 فقط لتقييم النموذج.

مجموعة البيانات	صفحة
LRS2	وصلة
LRS3	وصلة

أوزان ما قبل القطار

نموذج المولد

تحميل نموذج مولد الأوزان

نموذج	رابط التحميل
مولد	وصلة
مولد + SyncLoss	وصلة
مولد الاهتمام + SyncLoss	وصلة

تمييز لاندمارك SyncNet

قم بتنزيل الأوزان الخاصة برابط تنزيل نموذج SyncNet المستند إلى Landmark

الترجمة من صورة إلى صورة

يمكن تنزيل الوزن المدرب مسبقًا لنموذج Image2Image Translation من مستودع MakeItTalk في قسم النماذج المدربة مسبقًا Repo Link.

دليل

 ├── نقطة تفتيش # دليل لنقطة تفتيش النموذج │ └── مولد # ضع أوزان نموذج المولد هنا │ └── syncnet # ضع أوزان نموذج Landmark SyncNet هنا │ └── image2image # ضع أوزان نموذج ترجمة Image2Image هنا

تشغيل الاستدلال

python run_inference.py --generator_checkpoint <checkpoint_path> --image2image_checkpoint <checkpoint_path> --input_face <image/video_path> --input_audio <audio_source_path>

المعالجة المسبقة للبيانات

لقد استخدمت نفس طرق المعالجة المسبقة للبيانات مثل Wav2Lip لمزيد من التفاصيل حول بنية المجلد التي يمكن العثور عليها في مستودعهم هنا.

python preprocess_data.py --data_root data_root/main --preprocessed_root preprocessed_lrs2_landmark/

نموذج القطار

مولد

# CLI for traning attention generator with pretrain landmark SyncNet discriminator
python run_train_generator.py --model_type attnlstm --train_type pretrain --data_root preprocessed_lrs2_landmark/ --checkpoint_dir <folder_to_save_checkpoints>

لاندمارك سينك نت

# CLI for training pretrain landmark SyncNet discriminator
python run_train_syncnet.py --data_root preprocessed_lrs2_landmark/ --checkpoint_dir <folder_to_save_checkpoints>

قم بإنشاء فيديو للتقييم والمعيار من LRS2 وLRS3

استخدم هذا المشروع بيانات من مجموعة بيانات LRS2 وLRS3 للتقييم الكمي، ويتم توفير قائمة بيانات التقييم من Wav2Lip. تتوفر قائمة الملفات (بيانات الفيديو والصوت المستخدمة للتقييم) والتفاصيل حول معيار Lip Sync في مستودعها هنا.

إنشاء تقييم من قائمة الملفات

cd evaluation
# generate evaluation videos
python gen_eval_vdo.py --filelist <path> --data_root <path>  --model_type <type_of_model> --result_dir <save_path> --generator_checkpoint <gen_ckpt> --image2image_checkpoint <image2image_checkpoint>

شكر وتقدير

قاعدة التعليمات البرمجية لهذا المشروع مستوحاة من Wav2Lip وMakeItTalk. أود أن أشكر مؤلف كلا المشروعين على إتاحة تنفيذ التعليمات البرمجية لعملهم المذهل عبر الإنترنت.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2024-12-04
الحجم 1.41MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
node telegram bot api

كود الذكاء الاصطناعي

v0.50.0
typebot.io

كود الذكاء الاصطناعي

v3.1.2
python wechaty getting started

كود الذكاء الاصطناعي

1.0.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل