Antarmuka web untuk Difusi Stabil, diimplementasikan menggunakan perpustakaan Gradio.
Etalase fitur terperinci dengan gambar:
Mode txt2img dan img2img asli
Instal satu klik dan jalankan skrip (tetapi Anda masih harus menginstal python dan git)
Lukisan luar
melukis
Sketsa Warna
Matriks Cepat
Difusi Stabil Kelas Atas
Perhatian, tentukan bagian teks yang harus lebih diperhatikan oleh model
seorang pria dalam ((tuxedo))
- akan lebih memperhatikan tuksedo
seorang pria dalam (tuxedo:1.21)
- sintaksis alternatif
pilih teks dan tekan Ctrl+Up
atau Ctrl+Down
(atau Command+Up
atau Command+Down
jika Anda menggunakan MacOS) untuk secara otomatis menyesuaikan perhatian pada teks yang dipilih (kode disumbangkan oleh pengguna anonim)
Loopback, jalankan pemrosesan img2img beberapa kali
Plot X/Y/Z, cara menggambar plot gambar 3 dimensi dengan parameter berbeda
Inversi Tekstual
miliki embeddings sebanyak yang Anda inginkan dan gunakan nama apa pun yang Anda suka untuk embeddings tersebut
gunakan beberapa penyematan dengan jumlah vektor berbeda per token
bekerja dengan angka floating point setengah presisi
melatih embeddings pada 8GB (juga laporan 6GB berfungsi)
Tab ekstra dengan:
GFPGAN, jaringan saraf yang memperbaiki wajah
CodeFormer, alat restorasi wajah sebagai alternatif GFPGAN
RealESRGAN, peningkatan jaringan saraf
ESRGAN, peningkatan jaringan saraf dengan banyak model pihak ketiga
SwinIR dan Swin2SR (lihat di sini), peningkatan jaringan saraf
LDSR, Peningkatan resolusi super difusi laten
Mengubah ukuran opsi rasio aspek
Pemilihan metode pengambilan sampel
Sesuaikan nilai sampler eta (pengganda kebisingan)
Opsi pengaturan kebisingan lebih lanjut
Interupsi pemrosesan kapan saja
Dukungan kartu video 4GB (juga laporan 2GB berfungsi)
Benih yang benar untuk batch
Validasi panjang token langsung
Parameter pembangkitan
parameter yang Anda gunakan untuk menghasilkan gambar disimpan dengan gambar itu
dalam potongan PNG untuk PNG, dalam EXIF untuk JPEG
dapat menyeret gambar ke tab info PNG untuk memulihkan parameter pembuatan dan secara otomatis menyalinnya ke UI
dapat dinonaktifkan di pengaturan
seret dan lepas parameter gambar/teks ke kotak prompt
Tombol Baca Parameter Pembuatan, memuat parameter di kotak cepat ke UI
halaman pengaturan
Menjalankan kode python arbitrer dari UI (harus dijalankan dengan --allow-code
untuk mengaktifkan)
Petunjuk arahkan mouse untuk sebagian besar elemen UI
Memungkinkan untuk mengubah nilai default/mix/max/step untuk elemen UI melalui konfigurasi teks
Tiling support, kotak centang untuk membuat gambar yang dapat di-tile seperti tekstur
Bilah kemajuan dan pratinjau pembuatan gambar langsung
Dapat menggunakan jaringan saraf terpisah untuk menghasilkan pratinjau dengan hampir tidak ada VRAM atau persyaratan komputasi
Perintah negatif, bidang teks tambahan yang memungkinkan Anda membuat daftar apa yang tidak ingin Anda lihat pada gambar yang dihasilkan
Styles, cara untuk menyimpan bagian dari prompt dan menerapkannya dengan mudah melalui dropdown nanti
Variasi, cara menghasilkan gambar yang sama tetapi dengan perbedaan kecil
Pengubahan ukuran benih, suatu cara untuk menghasilkan gambar yang sama tetapi dengan resolusi yang sedikit berbeda
CLIP interrogator, tombol yang mencoba menebak prompt dari suatu gambar
Pengeditan Cepat, cara untuk mengubah generasi menengah yang cepat, katakanlah untuk mulai membuat semangka dan beralih ke gadis anime di tengah jalan
Batch Processing, memproses sekelompok file menggunakan img2img
Img2img Alternatif, membalikkan metode kontrol perhatian silang Euler
Highres Fix, pilihan kemudahan untuk menghasilkan gambar beresolusi tinggi dalam satu klik tanpa distorsi biasa
Memuat ulang pos pemeriksaan dengan cepat
Checkpoint Merger, tab yang memungkinkan Anda menggabungkan hingga 3 checkpoint menjadi satu
Skrip khusus dengan banyak ekstensi dari komunitas
Composable-Diffusion, cara menggunakan beberapa perintah sekaligus
perintah terpisah menggunakan huruf besar AND
juga mendukung bobot untuk petunjuknya: a cat :1.2 AND a dog AND a penguin :2.2
Tidak ada batasan token untuk permintaan (difusi stabil asli memungkinkan Anda menggunakan hingga 75 token)
Integrasi DeepDanbooru, membuat tag gaya danbooru untuk petunjuk anime
xformers, peningkatan kecepatan besar untuk kartu tertentu: (tambahkan --xformers
ke argumen baris perintah)
melalui ekstensi: tab Riwayat: melihat, mengarahkan, dan menghapus gambar dengan nyaman di dalam UI
Hasilkan opsi selamanya
Tab pelatihan
opsi hypernetwork dan embeddings
Pemrosesan awal gambar: cropping, mirroring, autotagging menggunakan BLIP atau deepdanbooru (untuk anime)
Lewati klip
jaringan hiper
Loras (sama seperti Hypernetworks tetapi lebih cantik)
UI terpisah tempat Anda dapat memilih, dengan pratinjau, penyematan, hypernetwork, atau Loras mana yang akan ditambahkan ke perintah Anda
Dapat memilih untuk memuat VAE yang berbeda dari layar pengaturan
Perkiraan waktu penyelesaian di bilah kemajuan
API
Dukungan untuk model inpainting khusus oleh RunwayML
melalui ekstensi: Aesthetic Gradients, cara untuk menghasilkan gambar dengan estetika tertentu dengan menggunakan penyematan gambar klip (implementasi https://github.com/vicgalle/stable-diffusion-aesthetic-gradients)
Dukungan Difusi Stabil 2.0 - lihat wiki untuk instruksi
Dukungan Alt-Diffusion - lihat wiki untuk instruksi
Sekarang tanpa surat buruk!
Muat pos pemeriksaan dalam format safetensor
Pembatasan resolusi dipermudah: dimensi gambar yang dihasilkan harus kelipatan 8, bukan 64
Sekarang dengan lisensi!
Susun ulang elemen di UI dari layar pengaturan
Dukungan Difusi Stabil Segmind
Pastikan dependensi yang diperlukan terpenuhi dan ikuti instruksi yang tersedia untuk:
NVidia (disarankan)
GPU AMD.
CPU Intel, GPU Intel (terintegrasi dan terpisah) (halaman wiki eksternal)
Ascend NPU (halaman wiki eksternal)
Alternatifnya, gunakan layanan online (seperti Google Colab):
Daftar Layanan Online
Unduh sd.webui.zip
dari v1.0.0-pre dan ekstrak isinya.
Jalankan update.bat
.
Jalankan run.bat
.
Untuk detail selengkapnya lihat Instal-dan-Jalankan-di-NVidia-GPU
Instal Python 3.10.6 (Versi terbaru Python tidak mendukung obor), centang "Tambahkan Python ke PATH".
Instal git.
Unduh repositori stable-diffusion-webui, misalnya dengan menjalankan git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
.
Jalankan webui-user.bat
dari Windows Explorer sebagai pengguna biasa, non-administrator.
Instal dependensi:
# Berbasis Debian: sudo apt install wget git python3 python3-venv libgl1 libglib2.0-0# Berbasis Red Hat: sudo dnf install wget git python3 gperftools-libs libglvnd-glx# berbasis openSUSE: sudo zypper install wget git python3 libtcmalloc4 libglvnd# Berbasis lengkungan:sudo pacman -S wget git python3
Jika sistem Anda masih sangat baru, Anda perlu menginstal python3.11 atau python3.10:
# Ubuntu 24.04sudo add-apt-repository ppa:deadsnakes/ppa sudo pembaruan yang tepat sudo apt install python3.11# Manjaro/Archsudo pacman -S yay yay -S python311 # jangan bingung dengan paket python3.11# Hanya untuk 3.11# Kemudian atur variabel env di launch scriptexport python_cmd="python3.11"# atau di webui-user.shpython_cmd="python3.11"
Arahkan ke direktori tempat Anda ingin menginstal webui dan jalankan perintah berikut:
wget -q https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh
Atau cukup kloning repo di mana pun Anda mau:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
Jalankan webui.sh
.
Periksa webui-user.sh
untuk opsi.
Temukan petunjuknya di sini.
Berikut cara menambahkan kode ke repo ini: Berkontribusi
Dokumentasi dipindahkan dari README ini ke wiki proyek.
Untuk tujuan membuat Google dan mesin pencari lainnya merayapi wiki, berikut ini tautan ke wiki yang dapat dirayapi (bukan untuk manusia).
Lisensi untuk kode yang dipinjam dapat ditemukan di layar Settings -> Licenses
, dan juga di file html/licenses.html
.
Difusi Stabil - https://github.com/Stability-AI/stablediffusion, https://github.com/CompVis/taming-transformers, https://github.com/mcmonkey4eva/sd3-ref
k-diffusion - https://github.com/crowsonkb/k-diffusion.git
Spandrel - https://github.com/chaiNNer-org/spandrel implementasi
GFPGAN - https://github.com/TencentARC/GFPGAN.git
CodeFormer - https://github.com/sczhou/CodeFormer
ESRGAN - https://github.com/xinntao/ESRGAN
SwinIR - https://github.com/JingyunLiang/SwinIR
Swin2SR - https://github.com/mv-lab/swin2sr
LDSR - https://github.com/Hafiidz/latent-diffusion
MiDaS - https://github.com/isl-org/MiDaS
Ide untuk pengoptimalan - https://github.com/basujindal/stable-diffusion
Pengoptimalan lapisan Cross Attention - Doggettx - https://github.com/Doggettx/stable-diffusion, ide orisinal untuk pengeditan cepat.
Pengoptimalan lapisan Cross Attention - InvokeAI, lstein - https://github.com/invoke-ai/InvokeAI (awalnya http://github.com/lstein/stable-diffusion)
Pengoptimalan lapisan Perhatian Silang Sub-kuadrat - Alex Birch (Birch-san/diffusers#1), Amin Rezaei (https://github.com/AminRezaei0x443/memory-efisien-attention)
Inversi Tekstual - Rinon Gal - https://github.com/rinongal/textual_inversion (kami tidak menggunakan kodenya, tapi kami menggunakan idenya).
Ide untuk SD kelas atas - https://github.com/jquesnelle/txt2imghd
Pembuatan kebisingan untuk pengecatan mk2 - https://github.com/parlance-zz/g-diffuser-bot
Ide interogator CLIP dan meminjam beberapa kode - https://github.com/pharmapsychotic/clip-interrogator
Ide untuk Difusi Terkomposisi - https://github.com/energy-based-model/Compositional-Visual-Generation-with-Composable-Diffusion-Models-PyTorch
xformers - https://github.com/facebookresearch/xformers
DeepDanbooru - interogator untuk penyebar anime https://github.com/KichangKim/DeepDanbooru
Pengambilan sampel dalam presisi float32 dari UNet float16 - marunine untuk idenya, Birch-san untuk contoh implementasi Diffusers (https://github.com/Birch-san/diffusers-play/tree/92feee6)
Instruksikan pix2pix - Tim Brooks (bintang), Aleksander Holynski (bintang), Alexei A. Efros (tanpa bintang) - https://github.com/timothybrooks/instruct-pix2pix
Saran keamanan - RyotaK
Sampel UniPC - Wenliang Zhao - https://github.com/wl-zhao/UniPC
TAESD - Ollin Boer Bohan - https://github.com/madebyollin/taesd
LyCORIS - KohakuDaun Biru
Mulai ulang pengambilan sampel - lambertae - https://github.com/Newbeeer/diffusion_restart_sampling
Hipertil - tfernd - https://github.com/tfernd/HyperTile
Skrip Gradio awal - diposting di 4chan oleh pengguna Anonim. Terima kasih pengguna Anonim.
(Anda)