Karena makalah ByteDance berjudul "MagicMix: Pencampuran Semantik dengan Model Difusi" (https://arxiv.org/abs/2210.16056) tidak mempublikasikan kodenya, saya telah mengimplementasikan notebook Jupyter di sini, sehingga Anda dapat mencobanya.
Notebook mengimplementasikan fungsi yang disebut magic_mix
yang mengambil jalur ke gambar dan perintah yang harus digunakan untuk mengadaptasi gambar tersebut.
Parameter opsional tambahan:
nu: mengontrol seberapa banyak prompt harus menimpa gambar asli pada tahap tata letak awal. Jika hasil Anda terlalu mendekati gambar asli, coba tingkatkan parameter ini.
total_steps: jumlah langkah inferensi untuk difusi stabil
skala_bimbingan: ini adalah panduan gratis pengklasifikasi. Semakin tinggi pengaturannya, semakin mengarahkan hasil Anda ke arah perintah Anda.
Contoh: