นี่เป็นพื้นที่เก็บข้อมูลอย่างเป็นทางการสำหรับชุดข้อมูลของเอกสาร Google DreamBooth: การปรับแต่งโมเดลการแพร่กระจายข้อความเป็นรูปภาพอย่างละเอียดสำหรับรุ่นที่ขับเคลื่อนด้วยหัวเรื่อง
ชุดข้อมูลประกอบด้วย 30 วิชาจาก 15 คลาสที่แตกต่างกัน 9 วิชาจากทั้งหมดนี้เป็นวิชาที่มีชีวิต (สุนัขและแมว) และ 21 วิชาเป็นวัตถุ ชุดข้อมูลมีจำนวนรูปภาพที่แปรผันต่อหัวเรื่อง (4-6) โดยปกติแล้วภาพของตัวแบบจะถูกบันทึกในสภาวะ สภาพแวดล้อม และภายใต้มุมที่ต่างกัน
เรารวมไฟล์ dataset/prompts_and_classes.txt ซึ่งประกอบด้วยข้อความแจ้งทั้งหมดที่ใช้ในรายงานสำหรับวิชาและออบเจ็กต์สด รวมถึงชื่อคลาสที่ใช้สำหรับวิชานั้นๆ
ภาพเหล่านี้ถ่ายโดยผู้เขียนรายงานหรือที่มาจาก www.unsplash.com
ไฟล์ dataset/references_and_licenses.txt มีรายการลิงก์อ้างอิงทั้งหมดไปยังรูปภาพใน www.unsplash.com และการระบุแหล่งที่มาของช่างภาพ พร้อมด้วยใบอนุญาตของรูปภาพ
หากคุณใช้งานนี้โปรดอ้างอิง:
@inproceedings{ruiz2023dreambooth,
title={Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation},
author={Ruiz, Nataniel and Li, Yuanzhen and Jampani, Varun and Pritch, Yael and Rubinstein, Michael and Aberman, Kfir},
booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
year={2023}
}
นี่ไม่ใช่ผลิตภัณฑ์ของ Google ที่ได้รับการสนับสนุนอย่างเป็นทางการ