이는 Google 논문 DreamBooth: 주제 중심 생성을 위한 텍스트-이미지 확산 모델 미세 조정의 데이터 세트에 대한 공식 저장소입니다.
데이터 세트에는 15개 클래스의 30개 주제가 포함되어 있습니다. 이들 피험자 중 9명은 살아있는 피험자(개와 고양이)이고 21명은 물체입니다. 데이터 세트에는 주제당 다양한 수의 이미지(4-6)가 포함되어 있습니다. 피사체의 이미지는 일반적으로 다양한 조건, 환경, 다양한 각도에서 캡처됩니다.
실제 주제와 개체에 대해 논문에 사용된 모든 프롬프트와 주제에 사용된 클래스 이름이 포함된 파일 데이터세트/prompts_and_classes.txt를 포함합니다.
이미지는 논문 작성자가 캡처했거나 www.unsplash.com에서 가져온 것입니다.
데이터 세트/references_and_licenses.txt 파일에는 www.unsplash.com의 이미지에 대한 모든 참조 링크 목록과 이미지 라이센스와 함께 사진 작가에 대한 귀속이 포함되어 있습니다.
이 저작물을 사용하는 경우 다음을 인용해 주세요.
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
이 제품은 공식적으로 지원되는 Google 제품이 아닙니다.