這是 Google 論文 DreamBooth:微調文字到圖像擴散模型以實現主題驅動生成的資料集的官方儲存庫。
此資料集包括 15 個不同類別的 30 個科目。其中 9 個是活體主體(狗和貓),21 個是物體。此資料集包含每個主題的可變數量的圖像 (4-6)。拍攝對象的影像通常是在不同條件、環境和不同角度下拍攝的。
我們包含一個檔案 dataset/prompts_and_classes.txt,其中包含論文中用於即時主題和物件的所有提示,以及用於主題的類別名稱。
這些圖像要么由論文作者捕獲,要么來自 www.unsplash.com
dataset/references_and_licenses.txt 檔案包含 www.unsplash.com 中影像的所有參考連結的清單 - 以及攝影師的歸屬,以及影像的許可。
如果您使用此作品,請引用:
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
這不是 Google 官方支援的產品。