เอกสาร: https://diffsynth-studio.readthedocs.io/zh-cn/latest/index.html
DiffSynth Studio เป็นเครื่องมือการแพร่กระจาย เรามีสถาปัตยกรรมที่ปรับโครงสร้างใหม่ เช่น Text Encoder, UNet, VAE และอื่นๆ โดยรักษาความเข้ากันได้กับโมเดลจากชุมชนโอเพ่นซอร์สในขณะเดียวกันก็เพิ่มประสิทธิภาพการประมวลผล เรามีคุณสมบัติที่น่าสนใจมากมาย เพลิดเพลินไปกับความมหัศจรรย์ของโมเดลการแพร่กระจาย!
จนถึงขณะนี้ DiffSynth Studio รองรับรุ่นต่อไปนี้:
25 ตุลาคม 2024 เราให้การสนับสนุน FLUX ControlNet อย่างกว้างขวาง โปรเจ็กต์นี้รองรับโมเดล ControlNet ที่แตกต่างกันจำนวนมากที่สามารถรวมเข้าด้วยกันได้อย่างอิสระ แม้ว่าโครงสร้างจะแตกต่างกันก็ตาม นอกจากนี้ รุ่น ControlNet ยังเข้ากันได้กับเทคนิคการปรับแต่งความละเอียดสูงและการควบคุมพาร์ติชัน ทำให้สามารถสร้างภาพที่ควบคุมได้อย่างทรงพลัง ดู . ./examples/ControlNet/
/
8 ตุลาคม 2024 เราเผยแพร่ LoRA แบบขยายตาม CogVideoX-5B และ ExVideo คุณสามารถดาวน์โหลดโมเดลนี้ได้จาก ModelScope หรือ HuggingFace
22 สิงหาคม 2024 CogVideoX-5B ได้รับการสนับสนุนในโปรเจ็กต์นี้ ดูที่นี่ เรานำเสนอคุณสมบัติที่น่าสนใจหลายประการสำหรับรูปแบบข้อความเป็นวิดีโอนี้ รวมถึง
22 สิงหาคม 2024 เราได้ใช้งานโปรแกรมระบายสีที่น่าสนใจซึ่งรองรับโมเดลข้อความเป็นรูปภาพทั้งหมด ตอนนี้คุณสามารถสร้างภาพที่น่าทึ่งโดยใช้จิตรกร ด้วยความช่วยเหลือจาก AI!
21 สิงหาคม 2024 รองรับ FLUX ใน DiffSynth-Studio
21 มิถุนายน 2567 ??? เราขอเสนอ ExVideo ซึ่งเป็นเทคนิคหลังการปรับแต่งที่มุ่งเพิ่มขีดความสามารถของโมเดลการสร้างวิดีโอ เราได้ขยาย Stable Video Diffusion เพื่อสร้างวิดีโอขนาดยาวได้ถึง 128 เฟรม
examples/ExVideo
13 มิถุนายน 2024 DiffSynth Studio ถูกโอนไปยัง ModelScope นักพัฒนาได้เปลี่ยนจาก "ฉัน" เป็น "เรา" แน่นอนว่าฉันจะยังคงมีส่วนร่วมในการพัฒนาและบำรุงรักษา
29 ม.ค. 2024 เราขอแนะนำ Diffutoon โซลูชั่นที่ยอดเยี่ยมสำหรับการแรเงาการ์ตูน
8 ธ.ค. 2023 เราตัดสินใจพัฒนาโปรเจ็กต์ใหม่โดยมีเป้าหมายเพื่อเผยแพร่ศักยภาพของโมเดลการแพร่กระจาย โดยเฉพาะอย่างยิ่งในการสังเคราะห์วิดีโอ การพัฒนาโครงการนี้จึงเริ่มต้นขึ้น
15 พ.ย. 2023 เราขอเสนอ FastBlend ซึ่งเป็นอัลกอริธึมการกะพริบของวิดีโออันทรงพลัง
1 ต.ค. 2023 เราเผยแพร่เวอร์ชันแรกของโปรเจ็กต์นี้ ซึ่งก็คือ FastSDXL การทดลองสร้างเครื่องยนต์แพร่
29 ส.ค. 2023 เราขอเสนอ DiffSynth ซึ่งเป็นเฟรมเวิร์กการสังเคราะห์วิดีโอ
ติดตั้งจากซอร์สโค้ด (แนะนำ):
git clone https://github.com/modelscope/DiffSynth-Studio.git
cd DiffSynth-Studio
pip install -e .
หรือติดตั้งจาก pypi:
pip install diffsynth
ตัวอย่าง Python อยู่ใน examples
เราให้ภาพรวมที่นี่
ดาวน์โหลดโมเดลที่ตั้งไว้ล่วงหน้า รหัสโมเดลสามารถพบได้ในไฟล์กำหนดค่า
from diffsynth import download_models
download_models ([ "FLUX.1-dev" , "Kolors" ])
ดาวน์โหลดโมเดลของคุณเอง
from diffsynth . models . downloader import download_from_huggingface , download_from_modelscope
# From Modelscope (recommended)
download_from_modelscope ( "Kwai-Kolors/Kolors" , "vae/diffusion_pytorch_model.fp16.bin" , "models/kolors/Kolors/vae" )
# From Huggingface
download_from_huggingface ( "Kwai-Kolors/Kolors" , "vae/diffusion_pytorch_model.fp16.safetensors" , "models/kolors/Kolors/vae" )
CogVideoX-5B เปิดตัวโดย ZhiPu เรามีไปป์ไลน์ที่ได้รับการปรับปรุง โดยรองรับการแปลงข้อความเป็นวิดีโอ การตัดต่อวิดีโอ การขยายขนาดด้วยตนเอง และการแก้ไขวิดีโอ examples/video_synthesis
วิดีโอทางด้านซ้ายสร้างขึ้นโดยใช้ไปป์ไลน์การแปลงข้อความเป็นวิดีโอต้นฉบับ ในขณะที่วิดีโอทางด้านขวาเป็นผลหลังจากการตัดต่อและการแก้ไขเฟรม
เราฝึกโมเดลการสังเคราะห์วิดีโอแบบขยาย ซึ่งสามารถสร้างได้ 128 เฟรม examples/ExVideo
เรนเดอร์วิดีโอที่สมจริงในรูปแบบแบนและเปิดใช้งานคุณสมบัติการตัดต่อวิดีโอ examples/Diffutoon
การปรับแต่งสไตล์วิดีโอโดยไม่มีโมเดลวิดีโอ examples/diffsynth
สร้างภาพที่มีความละเอียดสูง โดยทลายข้อจำกัดของโมเดลการแพร่กระจาย! examples/image_synthesis
รองรับการปรับแต่ง LoRA โดยละเอียดใน examples/train
ฟลักซ์ | การแพร่กระจายที่เสถียร 3 |
---|---|
![]() | ![]() |
สี | ฮุนหยวน-DiT |
---|---|
![]() | ![]() |
การแพร่กระจายที่เสถียร | การแพร่กระจายที่เสถียร XL |
---|---|
![]() | ![]() |
สร้างภาพที่น่าทึ่งโดยใช้จิตรกร ด้วยความช่วยเหลือจาก AI!
วิดีโอนี้ไม่ได้แสดงผลแบบเรียลไทม์
ก่อนที่จะเปิดตัว WebUI โปรดดาวน์โหลดโมเดลลงในโฟลเดอร์ ./models
models ดูที่นี่
Gradio
pip install gradio
python apps/gradio/DiffSynth_Studio.py
Streamlit
pip install streamlit streamlit-drawable-canvas
python -m streamlit run apps/streamlit/DiffSynth_Studio.py