Este é o repositório oficial do conjunto de dados do artigo do Google DreamBooth: Ajuste fino de modelos de difusão de texto para imagem para geração orientada por assunto.
O conjunto de dados inclui 30 disciplinas de 15 turmas diferentes. 9 desses assuntos são sujeitos vivos (cães e gatos) e 21 são objetos. O conjunto de dados contém um número variável de imagens por assunto (4-6). As imagens dos assuntos são geralmente capturadas em diferentes condições, ambientes e sob diferentes ângulos.
Incluímos um arquivo dataset/prompts_and_classes.txt que contém todos os prompts usados no artigo para assuntos e objetos ativos, bem como o nome da classe usada para os assuntos.
As imagens foram capturadas pelos autores do artigo ou provenientes de www.unsplash.com
O arquivo dataset/references_and_licenses.txt contém uma lista de todos os links de referência para as imagens em www.unsplash.com - e atribuição ao fotógrafo, junto com a licença da imagem.
Se você usar este trabalho, cite:
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
Este não é um produto do Google com suporte oficial.