ดาวน์โหลด PixArt sigma - ดาวน์โหลดซอร์สโค้ด PixArt sigma

PixArt sigma

ซอร์สโค้ดอื่น ๆ

ดาวน์โหลด

PixArt-Σ: การฝึก Diffusion Transformer จากน้อยไปมากสำหรับการสร้างข้อความเป็นภาพ 4K

การซื้อคืนนี้ประกอบด้วยคำจำกัดความของโมเดล PyTorch น้ำหนักที่ได้รับการฝึกอบรมล่วงหน้า และโค้ดการอนุมาน/การสุ่มตัวอย่างสำหรับรายงานของเราเกี่ยวกับการฝึกอบรม Diffusion Transformer จากระดับอ่อนถึงสูงสำหรับการสร้างข้อความเป็นภาพ 4K คุณสามารถดูการแสดงภาพเพิ่มเติมได้ในหน้าโครงการของเรา

PixArt-Σ: การฝึก Diffusion Transformer จากน้อยไปมากสำหรับการสร้างข้อความเป็นภาพ 4K
จุนซ่ง เฉิน*, ฉงเจี้ยนเกอ*, เอนเซ Xie*†, เยว่หวู่*, เล่เว่ย เหยา, เซียวเจ๋อเหริน, จงเตาหวาง, ปิงหลัว, หูชวน หลู, เจิ้งกั๋ว หลี่
Ark Lab ของ Huawei Noah, DLUT, HKU, HKUST

ยินดีต้อนรับทุกท่านร่วมบริจาค!!

จากการเรียนรู้จากโปรเจ็กต์ PixArt-α ก่อนหน้านี้ เราจะพยายามทำให้ repo นี้เรียบง่ายที่สุดเท่าที่จะเป็นไปได้ เพื่อให้ทุกคนในชุมชน PixArt สามารถใช้งานได้

ข่าวด่วน !!

(ใหม่) 24 เม.ย. 2024. ? - ดิฟฟิวเซอร์สนับสนุนเราตอนนี้! ยินดีด้วย!?. อย่าลืมอัปเดตจุดตรวจสอบตัวกระจายสัญญาณของคุณหนึ่งครั้งเพื่อให้พร้อมใช้งาน
(ใหม่) 24 เม.ย. 2024. ? รหัส LoRA ออกแล้ว!!
(✅ ใหม่) 23 เม.ย. 2024 ? PixArt-Σ 2K ckpt เปิดตัวแล้ว!!
(✅ใหม่) 16 เม.ย. 2024 ? PixArt-Σ มีการสาธิตออนไลน์แล้ว!!
(✅ใหม่) 16 เม.ย. 2024 ? โค้ดการฝึกอบรม PixArt-α-DMD One Step Generator ได้รับการเผยแพร่แล้ว!
(✅ใหม่) 11 เม.ย. 2024 ? PixArt-Σ สาธิต & PixArt-Σ ไปป์ไลน์! PixArt-Σ รองรับ ? diffusers ใช้แพทช์เพื่อประสบการณ์ที่รวดเร็ว!
(✅ใหม่) 10 เม.ย. 2024 ? PixArt-α-DMD โค้ดสาธิตตัวอย่างขั้นตอนเดียว & จุดตรวจสอบ PixArt-α-DMD 512px เปิดตัวแล้ว!
(✅ ใหม่) 9 เม.ย. 2024. ? จุดตรวจ PixArt-Σ 1024px เปิดตัวแล้ว!
(✅ ใหม่) 6 เม.ย. 2024. ? จุดตรวจ PixArt-Σ 256px & 512px เปิดตัวแล้ว!
(✅ ใหม่) 29 มี.ค. 2024 ? เปิดตัวการฝึกอบรม PixArt-Σ รหัสการอนุมาน และข้อมูลของเล่น!!!

สารบัญ

-หลัก

อ่อนแอถึงแข็งแกร่ง
การฝึกอบรม
การอนุมาน
ใช้ดิฟฟิวเซอร์
เปิดตัวการสาธิต
รุ่นที่มีจำหน่าย

-คำแนะนำ

การดึงข้อมูลคุณลักษณะ* (ไม่บังคับ)
การสร้างขั้นตอนเดียว (DMD)
โลรา และ โดรา
[LCM: เร็วๆ นี้]
[ControlNet: เร็วๆ นี้]
[ComfyUI: เร็ว ๆ นี้]
ฟอร์แมตข้อมูล* (ไม่บังคับ)

-คนอื่น

รับทราบ
การอ้างอิง
สิ่งที่ต้องทำ

- เปรียบเทียบกับ PixArt-α

แบบอย่าง	ความยาวโทเค็น T5	วีเออี	2K/4K
PixArt-Σ	300	SDXL
PixArt-α	120	SD1.5

แบบอย่าง	ตัวอย่าง-1	ตัวอย่าง-2	ตัวอย่าง-3
PixArt-Σ
PixArt-α
พรอมต์	ภาพระยะใกล้ ชายผมหงอก มีหนวดมีเคราในวัย 60 มองดูผู้คนเดินผ่านไปมา สวมเสื้อคลุมขนสัตว์และ หมวกเบเร่ต์สีน้ำตาล สวมแว่นตา ถ่ายภาพยนตร์	ภาพร่างกาย ผู้หญิงชาวฝรั่งเศส การถ่ายภาพ พื้นหลัง French Streets แบ็คไลท์ แสงไฟริม Fujifilm	วิดีโอโคลสอัพเสมือนจริงของเรือโจรสลัดสองลำต่อสู้กันขณะแล่นอยู่ใน ถ้วยกาแฟ

รายละเอียดพร้อมท์

ตัวอย่างที่ 1 พร้อมท์แบบเต็ม: ภาพระยะใกล้สุดขีดของชายผมหงอกมีหนวดเคราในวัย 60 ปี เขาครุ่นคิดถึงประวัติศาสตร์ของจักรวาลอย่างลึกซึ้งขณะที่เขานั่งอยู่ที่ร้านกาแฟในปารีส ดวงตาของเขาเพ่งไปที่ผู้คนนอกจอ ขณะที่พวกเขาเดินขณะที่เขานั่งนิ่งส่วนใหญ่ เขาสวมชุดโค้ตสูทโค้ตขนสัตว์พร้อมเสื้อเชิ้ตติดกระดุม เขาสวม**หมวกเบเร่ต์สีน้ำตาล** และแว่นตา และมีรูปลักษณ์ที่ดูเป็นศาสตราจารย์มาก และในตอนท้ายเขาก็เสนอท่าทีละเอียดอ่อน ปิดปาก ยิ้มราวกับว่าเขาพบคำตอบของความลึกลับของชีวิต การจัดแสงเป็นแบบภาพยนตร์ที่มีแสงสีทองและมีถนนและเมืองในปารีสเป็นฉากหลัง ระยะชัดลึก ฟิล์ม 35 มม. แบบภาพยนตร์

- การพึ่งพาและการติดตั้ง

Python >= 3.9 (แนะนำให้ใช้ Anaconda หรือ Miniconda)
PyTorch >= 2.0.1+cu11.7

conda create -n pixart python==3.9.0
conda activate pixart
conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.7 -c pytorch -c nvidia

git clone https://github.com/PixArt-alpha/PixArt-sigma.git
cd PixArt-sigma
pip install -r requirements.txt

วิธีการฝึก

1. การฝึกอบรม PixArt

ก่อนอื่นเลย.

เราเริ่มต้น repo ใหม่เพื่อสร้างฐานโค้ดที่เป็นมิตรต่อผู้ใช้และเข้ากันได้มากขึ้น โครงสร้างโมเดลหลักเหมือนกับ PixArt-α คุณยังคงสามารถพัฒนาฟังก์ชันของคุณบน repo ดั้งเดิมได้ ดังนั้น repo นี้จะรองรับ PixArt-alpha ในอนาคต

เคล็ดลับ

ตอนนี้คุณสามารถฝึกโมเดลของคุณได้โดยไม่ต้องแยกคุณสมบัติก่อน เราปฏิรูปโครงสร้างข้อมูลในฐานโค้ด PixArt-α เพื่อให้ทุกคนสามารถเริ่ม ฝึกอบรม & อนุมาน & เห็นภาพได้ ตั้งแต่เริ่มต้นโดยไม่มีความเจ็บปวดใด ๆ

1.1 ดาวน์โหลดชุดข้อมูลของเล่น

ดาวน์โหลดชุดข้อมูลของเล่นก่อน โครงสร้างชุดข้อมูลสำหรับการฝึกอบรมคือ:

 cd ./pixart-sigma-toy-dataset

Dataset Structure
├──InternImgs/  (images are saved here)
│  ├──000000000000.png
│  ├──000000000001.png
│  ├──......
├──InternData/
│  ├──data_info.json    (meta data)
Optional(?)
│  ├──img_sdxl_vae_features_1024resolution_ms_new    (run tools/extract_caption_feature.py to generate caption T5 features, same name as images except .npz extension)
│  │  ├──000000000000.npy
│  │  ├──000000000001.npy
│  │  ├──......
│  ├──caption_features_new
│  │  ├──000000000000.npz
│  │  ├──000000000001.npz
│  │  ├──......
│  ├──sharegpt4v_caption_features_new    (run tools/extract_caption_feature.py to generate caption T5 features, same name as images except .npz extension)
│  │  ├──000000000000.npz
│  │  ├──000000000001.npz
│  │  ├──......

1.2 ดาวน์โหลดด่านที่ผ่านการฝึกอบรมมาแล้ว

 # SDXL-VAE, T5 checkpoints
git lfs install
git clone https://huggingface.co/PixArt-alpha/pixart_sigma_sdxlvae_T5_diffusers output/pretrained_models/pixart_sigma_sdxlvae_T5_diffusers

# PixArt-Sigma checkpoints
python tools/download.py # environment eg. HF_ENDPOINT=https://hf-mirror.com can use for HuggingFace mirror

1.3 คุณพร้อมที่จะฝึกแล้ว!

การเลือกไฟล์ปรับแต่งที่คุณต้องการจากไฟล์ปรับแต่ง dir

python -m torch.distributed.launch --nproc_per_node=1 --master_port=12345 
          train_scripts/train.py 
          configs/pixart_sigma_config/PixArt_sigma_xl2_img512_internalms.py 
          --load-from output/pretrained_models/PixArt-Sigma-XL-2-512-MS.pth 
          --work-dir output/your_first_pixart-exp 
          --debug

วิธีการทดสอบ

1. เริ่มต้นอย่างรวดเร็วด้วย Gradio

ในการเริ่มต้น ให้ติดตั้งการขึ้นต่อกันที่จำเป็นก่อน ตรวจสอบให้แน่ใจว่าคุณได้ดาวน์โหลดไฟล์จุดตรวจสอบจากโมเดล (เร็วๆ นี้) ไปยังโฟลเดอร์ output/pretrained_models แล้วจึงรันบนเครื่องของคุณ:

 # SDXL-VAE, T5 checkpoints
git lfs install
git clone https://huggingface.co/PixArt-alpha/pixart_sigma_sdxlvae_T5_diffusers output/pixart_sigma_sdxlvae_T5_diffusers

# PixArt-Sigma checkpoints
python tools/download.py

# demo launch
python scripts/interface.py --model_path output/pretrained_models/PixArt-Sigma-XL-2-512-MS.pth --image_size 512 --port 11223

2. บูรณาการในดิฟฟิวเซอร์

สำคัญ

อัพเกรด diffusers ของคุณเพื่อทำให้ PixArtSigmaPipeline พร้อมใช้งาน!

pip install git+https://github.com/huggingface/diffusers

สำหรับ diffusers<0.28.0 โปรดตรวจสอบสคริปต์นี้เพื่อขอความช่วยเหลือ

 import torch
from diffusers import Transformer2DModel , PixArtSigmaPipeline

device = torch . device ( "cuda:0" if torch . cuda . is_available () else "cpu" )
weight_dtype = torch . float16

transformer = Transformer2DModel . from_pretrained (
    "PixArt-alpha/PixArt-Sigma-XL-2-1024-MS" , 
    subfolder = 'transformer' , 
    torch_dtype = weight_dtype ,
    use_safetensors = True ,
)
pipe = PixArtSigmaPipeline . from_pretrained (
    "PixArt-alpha/pixart_sigma_sdxlvae_T5_diffusers" ,
    transformer = transformer ,
    torch_dtype = weight_dtype ,
    use_safetensors = True ,
)
pipe . to ( device )

# Enable memory optimizations.
# pipe.enable_model_cpu_offload()

prompt = "A small cactus with a happy face in the Sahara desert."
image = pipe ( prompt ). images [ 0 ]
image . save ( "./catcus.png" )

3. การสาธิต PixArt

pip install git+https://github.com/huggingface/diffusers

# PixArt-Sigma 1024px
DEMO_PORT=12345 python app/app_pixart_sigma.py

# PixArt-Sigma One step Sampler(DMD)
DEMO_PORT=12345 python app/app_pixart_dmd.py

มาดูตัวอย่างง่ายๆ โดยใช้ http://your-server-ip:12345 กัน

4. แปลงจุดตรวจสอบ .pth เป็นเวอร์ชันตัวกระจาย

ดาวน์โหลดโดยตรงจาก Hugging Face

หรือรันด้วย:

pip install git+https://github.com/huggingface/diffusers

python tools/convert_pixart_to_diffusers.py --orig_ckpt_path output/pretrained_models/PixArt-Sigma-XL-2-1024-MS.pth --dump_path output/pretrained_models/PixArt-Sigma-XL-2-1024-MS --only_transformer=True --image_size=1024 --version sigma

⏬ รุ่นที่มีจำหน่าย

ทุกรุ่นจะถูกดาวน์โหลดโดยอัตโนมัติที่นี่ คุณสามารถเลือกดาวน์โหลดด้วยตนเองได้จาก URL นี้

แบบอย่าง	#พารามส์	เส้นทางด่าน	ดาวน์โหลดใน OpenXLab
T5 และ SDXL-VAE	4.5B	ตัวกระจาย: pixart_sigma_sdxlvae_T5_diffusers	เร็วๆ นี้
PixArt-Σ-256	0.6B	pth: PixArt-Sigma-XL-2-256x256.pth ตัวกระจายสัญญาณ: PixArt-Sigma-XL-2-256x256	เร็วๆ นี้
PixArt-Σ-512	0.6B	pth: PixArt-Sigma-XL-2-512-MS.pth ตัวกระจาย: PixArt-Sigma-XL-2-512-MS	เร็วๆ นี้
PixArt-α-512-DMD	0.6B	ตัวกระจายสัญญาณ: PixArt-Alpha-DMD-XL-2-512x512	เร็วๆ นี้
PixArt-Σ-1024	0.6B	pth: PixArt-Sigma-XL-2-1024-MS.pth ตัวกระจาย: PixArt-Sigma-XL-2-1024-MS	เร็วๆ นี้
PixArt-Σ-2K	0.6B	pth: PixArt-Sigma-XL-2-2K-MS.pth ตัวกระจายสัญญาณ: PixArt-Sigma-XL-2-2K-MS	เร็วๆ นี้

?รายการที่ต้องทำ

เราจะพยายามอย่างเต็มที่เพื่อเผยแพร่

?กิตติมศักดิ์

ขอบคุณ PixArt-α, DiT และ OpenDMD สำหรับผลงานและโค้ดเบสที่ยอดเยี่ยม!
ขอขอบคุณ Diffusers สำหรับการสนับสนุนทางเทคนิคที่ยอดเยี่ยมและการทำงานร่วมกันที่ยอดเยี่ยม!
ขอขอบคุณ Hugging Face สำหรับการสนับสนุนการสาธิตอย่างดี!

บิบเท็กซ์

 @misc{chen2024pixartsigma,
  title={PixArt-Sigma: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation},
  author={Junsong Chen and Chongjian Ge and Enze Xie and Yue Wu and Lewei Yao and Xiaozhe Ren and Zhongdao Wang and Ping Luo and Huchuan Lu and Zhenguo Li},
  year={2024},
  eprint={2403.04692},
  archivePrefix={arXiv},
  primaryClass={cs.CV}

ประวัติดารา

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2024-12-24
ขนาด 3.92MB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
SmartTube

ซอร์สโค้ดอื่น ๆ

24.71 Stable
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
wp functions

หมวดหมู่อื่นๆ

1.0.0
termwind

หมวดหมู่อื่นๆ

v2.3.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด