Download dreambooth - download do código-fonte dreambooth

dreambooth

Outro código-fonte

Baixar

Conjunto de dados DreamBooth

DreamBooth: Ajuste fino de modelos de difusão de texto para imagem para geração baseada em assunto

provocação

página do projeto | arxiv

Este é o repositório oficial do conjunto de dados do artigo do Google DreamBooth: Ajuste fino de modelos de difusão de texto para imagem para geração orientada por assunto.

Conjunto de dados

O conjunto de dados inclui 30 disciplinas de 15 turmas diferentes. 9 desses assuntos são sujeitos vivos (cães e gatos) e 21 são objetos. O conjunto de dados contém um número variável de imagens por assunto (4-6). As imagens dos assuntos são geralmente capturadas em diferentes condições, ambientes e sob diferentes ângulos.

Incluímos um arquivo dataset/prompts_and_classes.txt que contém todos os prompts usados no artigo para assuntos e objetos ativos, bem como o nome da classe usada para os assuntos.

As imagens foram capturadas pelos autores do artigo ou provenientes de www.unsplash.com

O arquivo dataset/references_and_licenses.txt contém uma lista de todos os links de referência para as imagens em www.unsplash.com - e atribuição ao fotógrafo, junto com a licença da imagem.

Citação Acadêmica

Se você usar este trabalho, cite:

 @inproceedings{ruiz2023dreambooth,
  title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
  author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  year={2023}
}