Ini adalah gudang resmi untuk kumpulan data makalah Google DreamBooth: Menyempurnakan Model Difusi Teks-ke-Gambar untuk Pembuatan Berbasis Subjek.
Dataset mencakup 30 subjek dari 15 kelas berbeda. 9 dari subjek tersebut adalah subjek hidup (anjing dan kucing) dan 21 subjek adalah objek. Kumpulan data berisi sejumlah variabel gambar per subjek (4-6). Gambar subjek biasanya diambil dalam kondisi, lingkungan, dan sudut berbeda.
Kami menyertakan file dataset/prompts_and_classes.txt yang berisi semua petunjuk yang digunakan dalam makalah untuk subjek dan objek langsung, serta nama kelas yang digunakan untuk subjek tersebut.
Gambar-gambar tersebut diambil oleh penulis makalah, atau bersumber dari www.unsplash.com
File dataset/references_and_licenses.txt berisi daftar semua tautan referensi ke gambar di www.unsplash.com - dan atribusi kepada fotografer, bersama dengan lisensi gambar.
Jika Anda menggunakan karya ini, harap kutip:
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
Ini bukan produk Google yang didukung secara resmi.