mmd-ddm
الاستدلال السريع في نماذج انتشار تقليل الضوضاء عبر MMD Finetuning
أصبحت نماذج نشر تقليل الضوضاء (DDMs) أداة شائعة لتوليد عينات عالية الجودة من توزيعات البيانات المعقدة. هذه النماذج قادرة على التقاط أنماط وهياكل معقدة في البيانات، ويمكنها إنشاء عينات شديدة التنوع وتمثل التوزيع الأساسي. ومع ذلك، فإن أحد القيود الرئيسية لنماذج الانتشار هو تعقيد إنشاء العينات، حيث يلزم وجود عدد كبير من الخطوات الزمنية للاستدلال لالتقاط توزيع البيانات بأمانة. في هذا البحث، نقدم MMD-DDM، وهي طريقة جديدة لأخذ عينات سريعة من نماذج الانتشار. يعتمد نهجنا على فكرة استخدام الحد الأقصى لتباين المتوسط (MMD) لضبط التوزيع المكتسب بميزانية معينة من الخطوات الزمنية. يسمح هذا للنموذج المضبوط بتحسين المفاضلة بين السرعة والجودة بشكل كبير، من خلال زيادة الدقة بشكل كبير في أنظمة الاستدلال بخطوات قليلة أو، بشكل مكافئ، عن طريق تقليل العدد المطلوب من الخطوات للوصول إلى الدقة المستهدفة، وبالتالي تمهيد الطريق لمزيد من الدقة. الاعتماد العملي لنماذج الانتشار في مجموعة واسعة من التطبيقات.
لضبط نموذج نشر مُدرب مسبقًا باستخدام إستراتيجية MMD-DDM المقترحة، قم بتنزيل النماذج المُدربة مسبقًا واضبط المسار في runners/diffusion.py، أو استخدم النماذج الموجودة في /function/ckpt_util.py وقم بتشغيل الأمر:
python main.py --config {DATASET}.yml --timesteps {num_timesteps (e.g 5)} --exp {PROJECT_PATH} --train
لأخذ عينات من الصورة التي تم إنشاؤها من النموذج الدقيق، اضبط المسار في وظيفة test_FID في runners/diffusion.py باستخدام النموذج الذي تم تدريبه حديثًا وقم بتشغيل:
python main.py --config {DATASET}.yml --timesteps {num_timesteps (e.g 5)} --test_FID
إذا وجدت أن MMD-DDM مفيد في بحثك، فيرجى مراعاة الاستشهاد بما يلي:
@article { aiello2023fast ,
title = { Fast Inference in Denoising Diffusion Models via MMD Finetuning } ,
author = { Aiello, Emanuele and Valsesia, Diego and Magli, Enrico } ,
journal = { arXiv preprint arXiv:2301.07969 } ,
year = { 2023 }
}
يعتمد هذا المستودع على التنفيذ الرسمي لـ DDIM: https://github.com/ermongroup/ddim
إذا كانت لديك أي أسئلة، فلا تتردد في فتح مشكلة أو الاتصال بنا على [email protected]
؟ ⛏️ ؟
سيتم إصدار النماذج المدربة مسبقًا قريبًا!