Unduh IP Adapter - Unduh Kode Sumber IP Adapter

IP Adapter

Kode sumber lainnya

1.0.0

Unduh

Adaptor IP: Adaptor Prompt Gambar Kompatibel Teks untuk Model Difusi Teks-ke-Teks

Perkenalan

Kami menyajikan Adaptor IP, adaptor yang efektif dan ringan untuk mencapai kemampuan cepat gambar untuk model difusi teks-ke-gambar yang sudah terlatih. Adaptor IP dengan hanya 22m parameter dapat mencapai kinerja yang sebanding atau bahkan lebih baik dengan model prompt gambar yang disetel. Adaptor IP dapat digeneralisasi tidak hanya untuk model kustom lain yang disempurnakan dari model dasar yang sama, tetapi juga untuk pembuatan yang dapat dikendalikan menggunakan alat yang dapat dikontrol yang ada. Selain itu, prompt gambar juga dapat bekerja dengan baik dengan prompt teks untuk mencapai pembuatan gambar multimodal.

lengkungan

Melepaskan

[2024/01/19] Tambahkan IP-Adapter-faceid-Portrait, informasi lebih lanjut dapat ditemukan di sini.
[2024/01/17] Tambahkan versi eksperimental IP-Adapter-FaceID-Plusv2 untuk SDXL, informasi lebih lanjut dapat ditemukan di sini.
[2024/01/04] Tambahkan versi eksperimental IP-Adapter-FaceID untuk SDXL, informasi lebih lanjut dapat ditemukan di sini.
[2023/12/29] Tambahkan versi eksperimental IP-Adapter-FaceID-Plusv2, informasi lebih lanjut dapat ditemukan di sini.
[2023/12/27] Tambahkan versi eksperimental IP-Adapter-faceid-plus, informasi lebih lanjut dapat ditemukan di sini.
[2023/12/20] Tambahkan versi eksperimental IP-Adapter-FaceID, informasi lebih lanjut dapat ditemukan di sini.
[2023/11/22] IP-Adapter tersedia di Diffusers berkat tim Diffusers.
[2023/11/10] Tambahkan versi iP-adapter-face yang diperbarui. Demo ada di sini.
[2023/11/05] Tambahkan demo Text-to-Image dengan IP-Adapter dan Kandinsky 2.2 sebelumnya
[2023/11/02] Dukung Safetensors
[2023/9/08] Perbarui versi baru IP-Adapter dengan SDXL_1.0. Informasi lebih lanjut dapat ditemukan di sini.
[2023/9/05] IP-Adapter didukung dalam WebUi dan Comfyui (atau comfyui_ipadapter_plus).
[2023/8/30] Tambahkan adaptor IP dengan gambar wajah sebagai prompt. Demo ada di sini.
[2023/8/29] Lepaskan kode pelatihan.
[2023/8/23] Tambahkan kode dan model adaptor IP dengan fitur berbutir halus. Demo ada di sini.
[2023/8/18] Tambahkan kode dan model untuk SDXL 1.0. Demo ada di sini.
[2023/8/16] Kami merilis kode dan model.

Instalasi

 # install latest diffusers
pip install diffusers==0.22.1

# install ip-adapter
pip install git+https://github.com/tencent-ailab/IP-Adapter.git

# download the models
cd IP-Adapter
git lfs install
git clone https://huggingface.co/h94/IP-Adapter
mv IP-Adapter/models models
mv IP-Adapter/sdxl_models sdxl_models

# then you can use the notebook

Unduh model

Anda dapat mengunduh model dari sini. Untuk menjalankan demo, Anda juga harus mengunduh model berikut:

RunwayML/Stable-Diffusion-V1-5
StabilityAi/SD-VAE-FT-MSE
Sg161222/realistis_vision_v4.0_novae
Model ControlNet

Cara menggunakan

SD_1.5

IP_ADAPTER_DEMO : Variasi gambar, gambar-ke-gambar, dan inpainting dengan prompt gambar.

Variasi gambar

gambar-ke-gambar

inpainting

IP_ADAPTER_CONTROLNET_DEMO , IP_ADAPTER_T2I-Adapter : pembuatan struktural dengan prompt gambar.

struktural_cond struktural_cond2

IP_ADAPTER_MULTIMODAL_PROMPTS_DEMO : Generasi dengan prompt multimodal.

multi_prompts

IP_ADAPTER-PLUS_DEMO : Demo Adapter IP dengan fitur berbutir halus.

ip_adpter_plus_image_variations IP_ADPTER_PLUS_MULTI

IP_ADAPTER-PLUS-FACE_DEMO : generasi dengan gambar wajah sebagai prompt.

ip_adpter_plus_face

Praktik terbaik

Jika Anda hanya menggunakan prompt gambar, Anda dapat mengatur scale=1.0 dan text_prompt="" (atau beberapa permintaan teks generik, misalnya "kualitas terbaik", Anda juga dapat menggunakan prompt teks negatif apa pun). Jika Anda menurunkan scale , gambar yang lebih beragam dapat dihasilkan, tetapi mereka mungkin tidak konsisten dengan prompt gambar.
Untuk petunjuk multimodal, Anda dapat menyesuaikan scale untuk mendapatkan hasil terbaik. Dalam kebanyakan kasus, scale=0.5 bisa mendapatkan hasil yang baik. Untuk versi SD 1.5, kami sarankan menggunakan model komunitas untuk menghasilkan gambar yang bagus.

Adaptor IP untuk gambar non-square

Karena gambar dipotong di tengah dalam prosesor gambar default klip, Adaptor IP bekerja paling baik untuk gambar persegi. Untuk gambar non -persegi, itu akan kehilangan informasi di luar pusat. Tetapi Anda hanya dapat mengubah ukuran menjadi 224x224 untuk gambar non-square, perbandingannya adalah sebagai berikut:

SDXL_1.0

IP_ADAPTER_SDXL_DEMO : Variasi gambar dengan prompt gambar.
IP_ADAPTER_SDXL_CONTROLNET_DEMO : pembuatan struktural dengan prompt gambar.

Perbandingan IP-adapter_xl dengan reimagine XL ditampilkan sebagai berikut:

sdxl_demo

Perbaikan dalam versi baru (2023.9.8) :

Beralih ke Clip-Vit-H : Kami melatih Adaptor IP baru dengan Openclip-Vit-H-14 alih-alih OpenClip-Vit-Bigg-14. Meskipun Vit-Bigg jauh lebih besar dari Vit-H, hasil eksperimen kami tidak menemukan perbedaan yang signifikan, dan model yang lebih kecil dapat mengurangi penggunaan memori pada fase inferensi.
Resep pelatihan yang lebih cepat dan lebih baik : Dalam versi kami sebelumnya, pelatihan langsung pada resolusi 1024x1024 terbukti sangat tidak efisien. Namun, dalam versi baru, kami telah menerapkan strategi pelatihan dua tahap yang lebih efektif. Pertama, kami melakukan pra-pelatihan pada resolusi 512x512. Kemudian, kami menggunakan strategi multi-skala untuk menyempurnakan. (Mungkin strategi pelatihan ini juga dapat digunakan untuk mempercepat pelatihan ControlNet).

Cara berlatih

Untuk pelatihan, Anda harus menginstal Accelerate dan membuat dataset Anda sendiri ke dalam file JSON.

 accelerate launch --num_processes 8 --multi_gpu --mixed_precision "fp16" 
  tutorial_train.py 
  --pretrained_model_name_or_path="runwayml/stable-diffusion-v1-5/" 
  --image_encoder_path="{image_encoder_path}" 
  --data_json_file="{data.json}" 
  --data_root_path="{image_path}" 
  --mixed_precision="fp16" 
  --resolution=512 
  --train_batch_size=8 
  --dataloader_num_workers=4 
  --learning_rate=1e-04 
  --weight_decay=0.01 
  --output_dir="{output_dir}" 
  --save_steps=10000

Setelah pelatihan selesai, Anda dapat mengonversi bobot dengan kode berikut:

 import torch
ckpt = "checkpoint-50000/pytorch_model.bin"
sd = torch . load ( ckpt , map_location = "cpu" )
image_proj_sd = {}
ip_sd = {}
for k in sd :
    if k . startswith ( "unet" ):
        pass
    elif k . startswith ( "image_proj_model" ):
        image_proj_sd [ k . replace ( "image_proj_model." , "" )] = sd [ k ]
    elif k . startswith ( "adapter_modules" ):
        ip_sd [ k . replace ( "adapter_modules." , "" )] = sd [ k ]

torch . save ({ "image_proj" : image_proj_sd , "ip_adapter" : ip_sd }, "ip_adapter.bin" )

Penggunaan pihak ketiga

Adaptor IP untuk WebUI [Catatan Rilis]
Adaptor IP untuk comfyui [ipadapter-comfyui atau comfyui_ipadapter_plus]
Adaptor IP untuk Invokeai [Catatan Rilis]
Adaptor IP untuk Perjalanan Prompt Animatediff
Diffusers_ipadapter: Lebih banyak fitur seperti mendukung beberapa gambar input
Diffuser resmi
InstantStyle: Transfer Gaya Berdasarkan Adaptor IP

Penafian

Proyek ini berusaha secara positif berdampak pada domain pembuatan gambar yang digerakkan oleh AI. Pengguna diberikan kebebasan untuk membuat gambar menggunakan alat ini, tetapi mereka diharapkan mematuhi hukum setempat dan menggunakannya dengan cara yang bertanggung jawab. Pengembang tidak bertanggung jawab atas potensi penyalahgunaan oleh pengguna.

Kutipan

Jika Anda menemukan IP-Adapter berguna untuk penelitian dan aplikasi Anda, silakan mengutip menggunakan Bibtex ini:

 @article { ye2023ip-adapter ,
  title = { IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models } ,
  author = { Ye, Hu and Zhang, Jun and Liu, Sibo and Han, Xiao and Yang, Wei } ,
  booktitle = { arXiv preprint arxiv:2308.06721 } ,
  year = { 2023 }
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-13
ukuran 73.95MB
Berasal dari Github

Aplikasi Terkait

ip location db

2024-11-10
Pemindai IP LAN v2020

2024-11-04
Pengubah IP v2020

2024-11-03
Aplikasi Urban Art Ip

2023-05-08
Basis data IP QQ

2009-06-22
Pencuri permintaan ip IP138

2009-05-08

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
wp functions

Kategori lainnya

1.0.0
termwind

Kategori lainnya

v2.3.0

Informasi Terkait Semua