هذا هو المستودع الرسمي لمجموعة البيانات الخاصة بورق Google DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation.
تتضمن مجموعة البيانات 30 موضوعًا من 15 فئة مختلفة. 9 من هذه المواضيع هي كائنات حية (الكلاب والقطط) و 21 كائنات. تحتوي مجموعة البيانات على عدد متغير من الصور لكل موضوع (4-6). عادةً ما يتم التقاط صور الأهداف في ظروف وبيئات مختلفة وتحت زوايا مختلفة.
نقوم بتضمين ملف dataset/prompts_and_classes.txt الذي يحتوي على جميع المطالبات المستخدمة في الورقة للمواضيع والكائنات الحية، بالإضافة إلى اسم الفئة المستخدم للمواضيع.
تم التقاط الصور بواسطة مؤلفي الورقة البحثية، أو تم الحصول عليها من www.unsplash.com
يحتوي ملف dataset/references_and_licenses.txt على قائمة بجميع الروابط المرجعية للصور الموجودة في www.unsplash.com - والإسناد إلى المصور، بالإضافة إلى ترخيص الصورة.
إذا كنت تستخدم هذا العمل يرجى ذكر:
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
هذا ليس أحد منتجات Google المدعومة رسميًا.