Это официальный репозиторий набора данных документа Google DreamBooth: точная настройка моделей диффузии текста в изображение для субъектно-ориентированной генерации.
Набор данных включает 30 субъектов 15 разных классов. 9 из этих субъектов — живые субъекты (собаки и кошки), а 21 — объекты. Набор данных содержит переменное количество изображений на предмет (4-6). Изображения предметов обычно делаются в разных условиях, обстановке и под разными углами.
Мы включаем файл dataset/prompts_and_classes.txt, который содержит все подсказки, используемые в статье для живых субъектов и объектов, а также имя класса, используемого для субъектов.
Изображения либо были сделаны авторами статьи, либо взяты с сайта www.unsplash.com.
Файл dataset/references_and_licenses.txt содержит список всех справочных ссылок на изображения на сайте www.unsplash.com, а также ссылку на фотографа и лицензию на изображение.
Если вы используете эту работу, пожалуйста, укажите:
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
Это не официально поддерживаемый продукт Google.