これは、Google 論文「DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation」のデータセットの公式リポジトリです。
データセットには、15 の異なるクラスの 30 人の被験者が含まれています。これらの対象のうち 9 件は生きた対象 (犬と猫)、21 件は物体です。データセットには、被験者ごとに可変数の画像 (4 ~ 6 枚) が含まれています。被写体の画像は通常、さまざまな条件、環境、さまざまな角度で撮影されます。
ファイル dataset/prompts_and_classes.txt が含まれています。このファイルには、論文内でライブの主題とオブジェクトに対して使用されているすべてのプロンプトと、主題に使用されているクラス名が含まれています。
画像は論文著者がキャプチャしたか、www.unsplash.com から入手したものです。
dataset/references_and_licenses.txt ファイルには、www.unsplash.com 内の画像へのすべての参照リンクのリストと、画像のライセンスとともに写真家の帰属が含まれています。
この著作物を使用する場合は、以下を引用してください。
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
これは正式にサポートされている Google 製品ではありません。