ดาวน์โหลด IP Adapter - ดาวน์โหลดซอร์สโค้ด IP Adapter

IP Adapter

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

IP-ADAPTER: อะแดปเตอร์พรอมต์ภาพที่เข้ากันได้

การแนะนำ

เรานำเสนออะแดปเตอร์ IP ซึ่งเป็นอะแดปเตอร์ที่มีประสิทธิภาพและมีน้ำหนักเบาเพื่อให้ได้ความสามารถในการพรอมต์ของภาพสำหรับรุ่นการแพร่กระจายข้อความไปยังภาพที่ผ่านการฝึกอบรมมาก่อน เครื่องปรับอากาศ IP ที่มีพารามิเตอร์เพียง 22 เมตรสามารถบรรลุประสิทธิภาพที่เทียบเคียงได้หรือดียิ่งขึ้นกับโมเดลพรอมต์ภาพที่ปรับแต่งได้ IP-ADAPTER สามารถสรุปได้ไม่เพียง แต่กับโมเดลที่กำหนดเองอื่น ๆ ที่ปรับแต่งจากรุ่นพื้นฐานเดียวกัน แต่ยังรวมถึงรุ่นควบคุมได้โดยใช้เครื่องมือควบคุมที่มีอยู่ ยิ่งกว่านั้นพรอมต์ภาพยังสามารถทำงานได้ดีกับข้อความแจ้งเตือนเพื่อสร้างภาพหลายรูปแบบให้สำเร็จ

โค้ง

ปล่อย

[2024/01/19] เพิ่ม ip-adapter-faceid-portrait ข้อมูลเพิ่มเติมสามารถพบได้ที่นี่
[2024/01/17] เพิ่มเวอร์ชันทดลองของ IP-ADAPTER-FACEID-PLUSV2 สำหรับ SDXL ข้อมูลเพิ่มเติมสามารถพบได้ที่นี่
[2024/01/04] เพิ่มเวอร์ชันทดลองของ IP-ADAPTER-FACEID สำหรับ SDXL ข้อมูลเพิ่มเติมสามารถพบได้ที่นี่
[2023/12/29] เพิ่มเวอร์ชันทดลองของ IP-ADAPTER-FACEID-PLUSV2, ข้อมูลเพิ่มเติมสามารถพบได้ที่นี่
[2023/12/27] เพิ่มเวอร์ชันทดลองของ IP-ADAPTER-FACEID-Plus ข้อมูลเพิ่มเติมสามารถพบได้ที่นี่
[2023/12/20] เพิ่มเวอร์ชันทดลองของ IP-Adapter-FaceID ข้อมูลเพิ่มเติมสามารถพบได้ที่นี่
[2023/11/22] IP-Adapter มีให้บริการใน diffusers ขอบคุณทีม diffusers
[2023/11/10] เพิ่ม ip-adapter-face เวอร์ชันที่อัปเดต การสาธิตอยู่ที่นี่
[2023/11/05] เพิ่มการสาธิตข้อความกับภาพด้วย IP-Adapter และ Kandinsky 2.2 ก่อน
[2023/11/02] สนับสนุน Safetensors
[2023/9/08] อัปเดต ip-adapter เวอร์ชันใหม่ด้วย SDXL_1.0 ข้อมูลเพิ่มเติมสามารถพบได้ที่นี่
[2023/9/05] IP-Adapter รองรับใน WebUI และ Comfyui (หรือ comfyui_ipadapter_plus)
[2023/8/30] เพิ่ม IP-adapter ด้วยภาพหน้าเป็นพรอมต์ การสาธิตอยู่ที่นี่
[2023/8/29] ปล่อยรหัสการฝึกอบรม
[2023/8/23] เพิ่มรหัสและรุ่นของ ADAPTER IP พร้อมคุณสมบัติที่ละเอียด การสาธิตอยู่ที่นี่
[2023/8/18] เพิ่มรหัสและรุ่นสำหรับ SDXL 1.0 การสาธิตอยู่ที่นี่
[2023/8/16] เราปล่อยรหัสและรุ่น

การติดตั้ง

 # install latest diffusers
pip install diffusers==0.22.1

# install ip-adapter
pip install git+https://github.com/tencent-ailab/IP-Adapter.git

# download the models
cd IP-Adapter
git lfs install
git clone https://huggingface.co/h94/IP-Adapter
mv IP-Adapter/models models
mv IP-Adapter/sdxl_models sdxl_models

# then you can use the notebook

ดาวน์โหลดรุ่น

คุณสามารถดาวน์โหลดรุ่นจากที่นี่ ในการเรียกใช้การสาธิตคุณควรดาวน์โหลดรุ่นต่อไปนี้:

RunwayML/Stable-Diffusion-V1-5
ความเสถียร/SD-VAE-FT-MSE
sg161222/unalistic_vision_v4.0_novae
โมเดล Controlnet

วิธีใช้

SD_1.5

IP_ADAPTER_DEMO : รูปแบบของภาพ, ภาพเป็นภาพและ inpainting ด้วยพรอมต์รูปภาพ

รูปแบบของภาพ

ภาพต่อภาพ

การทาสี

IP_ADAPTER_CONTROLNET_DEMO , IP_ADAPTER_T2I-ADAPTER : การสร้างโครงสร้างพร้อมพรอมต์รูปภาพ

structural_cond structural_cond2

IP_ADAPTER_MULTIMODAL_PROMPTS_DEMO : การสร้างด้วยพรอมต์หลายรูปแบบ

multi_prompts

IP_ADAPTER-PLUS_DEMO : การสาธิตของ ADAPTER IP พร้อมคุณสมบัติที่ละเอียด

ip_adpter_plus_image_variations ip_adpter_plus_multi

ip_adapter-plus-face_demo : การสร้างด้วยภาพหน้าเป็นพรอมต์

ip_adpter_plus_face

แนวปฏิบัติที่ดีที่สุด

หากคุณใช้พรอมต์ภาพเท่านั้นคุณสามารถตั้ง scale=1.0 และ text_prompt="" (หรือข้อความแจ้งทั่วไปบางอย่างเช่น "คุณภาพที่ดีที่สุด" คุณสามารถใช้ข้อความข้อความเชิงลบใด ๆ ) หากคุณลด scale ภาพที่มีความหลากหลายมากขึ้นสามารถสร้างได้ แต่อาจไม่สอดคล้องกับพรอมต์ภาพ
สำหรับพรอมต์หลายรูปแบบคุณสามารถปรับ scale เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด ในกรณีส่วนใหญ่การตั้ง scale=0.5 จะได้ผลลัพธ์ที่ดี สำหรับรุ่น SD 1.5 เราขอแนะนำให้ใช้โมเดลชุมชนเพื่อสร้างภาพที่ดี

IP-ADAPTER สำหรับภาพที่ไม่ใช่สแควร์

เนื่องจากภาพเป็นศูนย์ที่ถูกครอบตัดในตัวประมวลผลภาพเริ่มต้นของคลิป Adapter IP ทำงานได้ดีที่สุดสำหรับภาพสี่เหลี่ยมจัตุรัส สำหรับภาพที่ไม่ใช่สแควร์มันจะพลาดข้อมูลนอกศูนย์ แต่คุณสามารถปรับขนาดเป็น 224x224 สำหรับภาพที่ไม่ใช่สี่เหลี่ยมจัตุรัสการเปรียบเทียบมีดังนี้:

sdxl_1.0

IP_ADAPTER_SDXL_DEMO : รูปแบบของภาพพร้อมพรอมต์รูปภาพ
IP_ADAPTER_SDXL_CONTROLNET_DEMO : การสร้างโครงสร้างพร้อมพรอมต์รูปภาพ

การเปรียบเทียบ IP-ADAPTER_XL กับ Reimagine XL จะแสดงดังนี้:

sdxl_demo

การปรับปรุงในเวอร์ชันใหม่ (2023.9.8) :

สลับไปที่ Clip-vit-H : เราได้ฝึกฝน IP-adapter ใหม่ด้วย OpenCLIP-VIT-H-14 แทนที่จะเป็น OpenCLIP-VIT-BIGG-14 แม้ว่า Vit-Bigg นั้นมีขนาดใหญ่กว่า VIT-H แต่ผลการทดลองของเราไม่พบความแตกต่างอย่างมีนัยสำคัญและโมเดลขนาดเล็กสามารถลดการใช้หน่วยความจำในขั้นตอนการอนุมาน
สูตรการฝึกอบรมที่เร็วขึ้นและดีขึ้น : ในเวอร์ชันก่อนหน้าของเราการฝึกอบรมโดยตรงที่ความละเอียด 1024x1024 พิสูจน์แล้วว่าไม่มีประสิทธิภาพสูง อย่างไรก็ตามในเวอร์ชันใหม่เราได้ใช้กลยุทธ์การฝึกอบรมสองขั้นตอนที่มีประสิทธิภาพมากขึ้น ประการแรกเราทำการฝึกอบรมล่วงหน้าด้วยความละเอียด 512x512 จากนั้นเราใช้กลยุทธ์หลายระดับสำหรับการปรับแต่ง (บางทีกลยุทธ์การฝึกอบรมนี้อาจใช้เพื่อเร่งการฝึกอบรมของ ControlNet)

วิธีการฝึกอบรม

สำหรับการฝึกอบรมคุณควรติดตั้งเร่งความเร็วและสร้างชุดข้อมูลของคุณเองลงในไฟล์ JSON

 accelerate launch --num_processes 8 --multi_gpu --mixed_precision "fp16" 
  tutorial_train.py 
  --pretrained_model_name_or_path="runwayml/stable-diffusion-v1-5/" 
  --image_encoder_path="{image_encoder_path}" 
  --data_json_file="{data.json}" 
  --data_root_path="{image_path}" 
  --mixed_precision="fp16" 
  --resolution=512 
  --train_batch_size=8 
  --dataloader_num_workers=4 
  --learning_rate=1e-04 
  --weight_decay=0.01 
  --output_dir="{output_dir}" 
  --save_steps=10000

เมื่อการฝึกเสร็จสมบูรณ์คุณสามารถแปลงน้ำหนักด้วยรหัสต่อไปนี้:

 import torch
ckpt = "checkpoint-50000/pytorch_model.bin"
sd = torch . load ( ckpt , map_location = "cpu" )
image_proj_sd = {}
ip_sd = {}
for k in sd :
    if k . startswith ( "unet" ):
        pass
    elif k . startswith ( "image_proj_model" ):
        image_proj_sd [ k . replace ( "image_proj_model." , "" )] = sd [ k ]
    elif k . startswith ( "adapter_modules" ):
        ip_sd [ k . replace ( "adapter_modules." , "" )] = sd [ k ]

torch . save ({ "image_proj" : image_proj_sd , "ip_adapter" : ip_sd }, "ip_adapter.bin" )

การใช้งานของบุคคลที่สาม

IP-ADAPTER สำหรับ WebUI [Notes Release]
ip-adapter สำหรับ comfyui [ipadapter-comfyui หรือ comfyui_ipadapter_plus]
IP-ADAPTER สำหรับ Invokeai [Notes Release]
IP-ADAPTER สำหรับการเดินทางพร้อมด้วยภาพเคลื่อนไหว
diffusers_ipadapter: คุณสมบัติเพิ่มเติมเช่นการสนับสนุนหลายภาพอินพุต
diffusers อย่างเป็นทางการ
InstantStyle: การถ่ายโอนสไตล์ตาม IP-ADAPTER

คำเตือน

โครงการนี้มุ่งมั่นที่จะส่งผลกระทบในเชิงบวกต่อโดเมนของการสร้างภาพที่ขับเคลื่อนด้วย AI ผู้ใช้จะได้รับอิสระในการสร้างภาพโดยใช้เครื่องมือนี้ แต่คาดว่าจะปฏิบัติตามกฎหมายท้องถิ่นและใช้มันอย่างรับผิดชอบ นักพัฒนาไม่รับผิดชอบต่อการใช้ในทางที่ผิดโดยผู้ใช้

การอ้างอิง

หากคุณพบว่าเครื่องปรับอากาศ IP มีประโยชน์สำหรับการวิจัยและแอปพลิเคชันของคุณโปรดอ้างอิงการใช้ BibTex นี้:

 @article { ye2023ip-adapter ,
  title = { IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models } ,
  author = { Ye, Hu and Zhang, Jun and Liu, Sibo and Han, Xiao and Yang, Wei } ,
  booktitle = { arXiv preprint arxiv:2308.06721 } ,
  year = { 2023 }
}