这是 Google 论文 DreamBooth:微调文本到图像扩散模型以实现主题驱动生成的数据集的官方存储库。
该数据集包括 15 个不同类别的 30 个科目。其中 9 个是活体主体(狗和猫),21 个是物体。该数据集包含每个主题的可变数量的图像 (4-6)。拍摄对象的图像通常是在不同条件、环境和不同角度下拍摄的。
我们包含一个文件 dataset/prompts_and_classes.txt,其中包含论文中用于实时主题和对象的所有提示,以及用于主题的类名。
这些图像要么由论文作者捕获,要么来自 www.unsplash.com
dataset/references_and_licenses.txt 文件包含 www.unsplash.com 中图像的所有参考链接的列表 - 以及摄影师的归属,以及图像的许可。
如果您使用此作品,请引用:
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
这不是 Google 官方支持的产品。