IP Adapter下載 - IP Adapter源代碼下載

IP Adapter

其他源碼

1.0.0

下載

IP-ADAPTER：文本兼容圖像提示適配器，用於文本到圖像擴散模型

介紹

我們提出IP-ADAPTER，這是一種有效且輕巧的適配器，可為預訓練的文本對圖像擴散模型實現圖像及時的能力。只有2200萬參數的IP-適配器可以與微調圖像提示模型實現可比甚至更好的性能。 IP-ADAPTER不僅可以從同一基本模型中進行微調的其他自定義模型進行概括，還可以使用現有可控工具來控制可控生成。此外，圖像提示也可以與文本提示符效果很好，以完成多模式圖像生成。

發布

[2024/01/19]添加IP-ADAPTER-FACEID-PORTRAIT，可以在此處找到更多信息。
[2024/01/17]為SDXL添加了IP-ADAPTER-FACEID-PLUSV2的實驗版本，可以在此處找到更多信息。
[2024/01/04]添加用於SDXL的IP-Adapter-faceID的實驗版本，可以在此處找到更多信息。
[2023/12/29]添加了IP-ADAPTER-FACEID-PLUSV2的實驗版，可以在此處找到更多信息。
[2023/12/27]添加了IP-ADAPTER-FACEID-PLUS的實驗版本，可以在此處找到更多信息。
[2023/12/20]添加了IP-ADAPTER-FACEID的實驗版本，可以在此處找到更多信息。
[2023/11/22]由於擴散器團隊，擴散器可以在擴散器中獲得IP-Adapter。
[2023/11/10]添加了IP-ADAPTER-FACE的更新版本。演示在這裡。
[2023/11/05]與IP-ADAPTER和KANDINSKY添加文本對圖像演示2.2先驗
[2023/11/02]支持SafetEnsors
[2023/9/08]使用SDXL_1.0更新新版本的IP-Adapter。更多信息可以在此處找到。
[2023/9/05] webui和comfyui（或comfyui_ipadapter_plus）支持IP-Adapter。
[2023/8/30]及時添加帶有面部圖像的IP-ADAPTER。演示在這裡。
[2023/8/29]發布培訓代碼。
[2023/8/23]添加具有精細功能的IP-ADAPTER的代碼和型號。演示在這裡。
[2023/8/18]添加SDXL 1.0的代碼和型號。演示在這裡。
[2023/8/16]我們發布代碼和模型。

安裝

 # install latest diffusers
pip install diffusers==0.22.1

# install ip-adapter
pip install git+https://github.com/tencent-ailab/IP-Adapter.git

# download the models
cd IP-Adapter
git lfs install
git clone https://huggingface.co/h94/IP-Adapter
mv IP-Adapter/models models
mv IP-Adapter/sdxl_models sdxl_models

# then you can use the notebook

下載型號

您可以從這裡下載模型。要運行演示，您還應該下載以下模型：

跑道/穩定 - 擴散-V1-5
穩定性/SD-VAE-FT-MSE
sg161222/loreistic_vision_v4.0_novae
ControlNet模型

如何使用

SD_1.5

IP_ADAPTER_DEMO ：圖像變化，圖像到圖像和圖像提示。

圖像變化

圖像到圖像

IP_ADAPTER_CONTROLNET_DEMO ， IP_ADAPTER_T2I-ADAPTER ：圖像提示的結構生成。

structural_cond structural_cond2

IP_ADAPTER_MULTIMODAL_PROMPTS_DEMO ：具有多模式提示的生成。

Multi_prompts

IP_ADAPTER-PLUS_DEMO ：具有細粒功能的IP-ADAPTER的演示。

ip_adpter_plus_image_variations ip_adpter_plus_multi

ip_adapter-plus-face_demo ：以面部圖像為提示。

ip_adpter_plus_face

最佳實踐

如果僅使用圖像提示符，則可以設置scale=1.0和text_prompt="" （或某些通用文本提示，例如“最佳質量”，也可以使用任何負面文本提示）。如果您降低了scale ，則可以生成更多樣化的圖像，但它們可能與圖像提示不像。
對於多模式提示，您可以調整scale以獲得最佳結果。在大多數情況下，設置scale=0.5可以獲得良好的結果。對於SD 1.5的版本，我們建議使用社區模型來生成良好的圖像。

非平方圖像的IP-ADAPTER

由於圖像是在剪輯的默認圖像處理器中裁剪的中心，因此IP型適配器最適合平方圖像。對於非正方形圖像，它將錯過中心以外的信息。但是，對於非平方圖像，您只能調整大小為224x224，比較如下：

SDXL_1.0

IP_ADAPTER_SDXL_DEMO ：圖像提示的圖像變化。
IP_ADAPTER_SDXL_CONTROLNET_DEMO ：帶有圖像提示的結構生成。

IP-ADAPTER_XL與Reimagine XL的比較如下：

sdxl_demo

改進新版本（2023.9.8） ：

切換到clip-vit-H ：我們使用OpenClip-vit-H-14而不是OpenClip-vit-bigg-14訓練了新的IP-ADAPTER。儘管VIT-BIGG比VIT-H要大得多，但我們的實驗結果沒有發現顯著差異，並且較小的模型可以減少推理階段的記憶使用量。
更快，更好的培訓食譜：在我們以前的版本中，直接以1024x1024分辨率培訓被證明非常低效。但是，在新版本中，我們實施了更有效的兩階段培訓策略。首先，我們以512x512的分辨率進行預訓練。然後，我們採用多尺度策略進行微調。（也許這種培訓策略也可以用來加快控製網的訓練）。

如何訓練

對於培訓，您應該安裝加速並將自己的數據集放入JSON文件中。

 accelerate launch --num_processes 8 --multi_gpu --mixed_precision "fp16" 
  tutorial_train.py 
  --pretrained_model_name_or_path="runwayml/stable-diffusion-v1-5/" 
  --image_encoder_path="{image_encoder_path}" 
  --data_json_file="{data.json}" 
  --data_root_path="{image_path}" 
  --mixed_precision="fp16" 
  --resolution=512 
  --train_batch_size=8 
  --dataloader_num_workers=4 
  --learning_rate=1e-04 
  --weight_decay=0.01 
  --output_dir="{output_dir}" 
  --save_steps=10000

培訓完成後，您可以使用以下代碼轉換權重：

 import torch
ckpt = "checkpoint-50000/pytorch_model.bin"
sd = torch . load ( ckpt , map_location = "cpu" )
image_proj_sd = {}
ip_sd = {}
for k in sd :
    if k . startswith ( "unet" ):
        pass
    elif k . startswith ( "image_proj_model" ):
        image_proj_sd [ k . replace ( "image_proj_model." , "" )] = sd [ k ]
    elif k . startswith ( "adapter_modules" ):
        ip_sd [ k . replace ( "adapter_modules." , "" )] = sd [ k ]

torch . save ({ "image_proj" : image_proj_sd , "ip_adapter" : ip_sd }, "ip_adapter.bin" )

第三方使用

WebUI的IP-ADAPTER [發行說明]
comfyui的ip-ap.ter [ipadapter-comfyui或comfyui_ipadapter_plus]
Invokeai的IP-ADAPTER [發行說明]
Animatediff提示旅行的IP-ADAPTER
diffusers_ipadapter：更多功能，例如支持多個輸入圖像
官方擴散器
InstantStyle：基於IP-ADAPTER的樣式轉移

免責聲明

該項目致力於積極影響AI驅動圖像生成的領域。授予用戶使用此工具創建圖像的自由，但期望他們遵守本地法律並以負責任的方式使用它。開發人員對用戶的潛在濫用不承擔任何責任。

引用

如果您發現IP-適配器對您的研究和應用程序有用，請使用此Bibtex引用：

 @article { ye2023ip-adapter ,
  title = { IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models } ,
  author = { Ye, Hu and Zhang, Jun and Liu, Sibo and Han, Xiao and Yang, Wei } ,
  booktitle = { arXiv preprint arxiv:2308.06721 } ,
  year = { 2023 }
}

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2025-02-13
大小 73.95MB
來自於 Github

相關應用

ip location db

2024-11-10
區域網路IP掃描器v2020

2024-11-04
IP修改器v2020

2024-11-03
城市藝術Ip app

2023-05-08
QQ IP資料庫

2009-06-22
IP138 ip查詢小偷

2009-05-08

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
SmartTube

其他源碼

24.71 Stable
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
wp functions

其他類別

1.0.0
termwind

其他類別

v2.3.0

相關資訊全部