تنزيل DiffSynth Studio - تنزيل كود مصدر DiffSynth Studio

DiffSynth Studio

شفرة المصدر الأخرى

v1.0.0

تنزيل

استوديو ديفسينث

المستند: https://diffsynth-studio.readthedocs.io/zh-cn/latest/index.html

مقدمة

DiffSynth Studio هو محرك انتشار. لقد قمنا بإعادة هيكلة البنى بما في ذلك Text Encoder وUNet وVAE وغيرها، مع الحفاظ على التوافق مع النماذج من مجتمع المصادر المفتوحة مع تحسين الأداء الحسابي. نحن نقدم العديد من الميزات المثيرة للاهتمام. استمتع بسحر نماذج الانتشار!

حتى الآن، يدعم DiffSynth Studio النماذج التالية:

CogVideoX
تدفق
exVideo
كولورز
انتشار مستقر 3
نشر الفيديو مستقر
هونيوان-ديت
منتشر
إسرغان
محول IP
AnimateDiff
كونترول نت
انتشار مستقر XL
انتشار مستقر

أخبار

25 أكتوبر 2024 نحن نقدم دعمًا شاملاً لـ FLUX ControlNet. يدعم هذا المشروع العديد من نماذج ControlNet المختلفة التي يمكن دمجها بحرية، حتى لو اختلفت بنياتها. بالإضافة إلى ذلك، تتوافق نماذج ControlNet مع تقنيات التحسين والتحكم في الأقسام عالية الدقة، مما يتيح إنشاء صور قوية للغاية يمكن التحكم فيها. راجع ./examples/ControlNet/ .
8 أكتوبر 2024. قمنا بإصدار LoRA الممتد استنادًا إلى CogVideoX-5B وExVideo. يمكنك تنزيل هذا النموذج من ModelScope أو HuggingFace.
22 أغسطس 2024. يتم دعم CogVideoX-5B في هذا المشروع. انظر هنا. نحن نقدم العديد من الميزات المثيرة للاهتمام لنموذج تحويل النص إلى فيديو، بما في ذلك
- النص إلى الفيديو
- تحرير الفيديو
- الارتقاء الذاتي
- الاستيفاء الفيديو
22 أغسطس 2024. لقد قمنا بتنفيذ رسام مثير للاهتمام يدعم جميع نماذج تحويل النص إلى صورة. يمكنك الآن إنشاء صور مذهلة باستخدام الرسام بمساعدة الذكاء الاصطناعي!
- استخدامه في WebUI لدينا.
21 أغسطس 2024. FLUX مدعوم في DiffSynth-Studio.
- قم بتمكين CFG وhighres-fix لتحسين جودة الصورة. انظر هنا
- ستتوفر نماذج LoRA وControlNet ونماذج إضافية قريبًا.
21 يونيو 2024. ؟؟؟ نقترح ExVideo، وهي تقنية ما بعد الضبط تهدف إلى تعزيز قدرة نماذج توليد الفيديو. لقد قمنا بتوسيع نشر الفيديو الثابت لتحقيق إنشاء مقاطع فيديو طويلة تصل إلى 128 إطارًا.
- صفحة المشروع
- تم إصدار كود المصدر في هذا الريبو. انظر examples/ExVideo .
- يتم إصدار النماذج على HuggingFace وModelScope.
- تم إصدار التقرير الفني على arXiv.
- يمكنك تجربة ExVideo في هذا العرض التوضيحي!
13 يونيو 2024. تم نقل DiffSynth Studio إلى ModelScope. لقد انتقل المطورون من "أنا" إلى "نحن". وبطبيعة الحال، سأظل أشارك في التطوير والصيانة.
29 يناير 2024. نقترح Diffutoon، وهو حل رائع لتظليل الرسوم المتحركة.
- صفحة المشروع
- يتم إصدار أكواد المصدر في هذا المشروع.
- تم إصدار التقرير الفني (IJCAI 2024) على arXiv.
8 ديسمبر 2023. قررنا تطوير مشروع جديد يهدف إلى إطلاق إمكانات نماذج الانتشار، خاصة في تركيب الفيديو. بدأ تطوير هذا المشروع.
15 نوفمبر 2023. نقترح استخدام FastBlend، وهو خوارزمية قوية لإزالة انعكاس الفيديو.
- تم إصدار ملحق sd-webui على GitHub.
- يتم عرض مقاطع الفيديو التوضيحية على Bilibili، بما في ذلك ثلاث مهام.
  - إزالة الوميض من الفيديو
  - الاستيفاء الفيديو
  - عرض الفيديو المبني على الصور
- تم إصدار التقرير الفني على arXiv.
- تم إصدار ملحق ComfyUI غير رسمي تم تطويره بواسطة مستخدمين آخرين على GitHub.
1 أكتوبر 2023. قمنا بإصدار نسخة مبكرة من هذا المشروع، وهي FastSDXL. محاولة لبناء محرك الانتشار.
- يتم إصدار أكواد المصدر على GitHub.
- يتضمن FastSDXL جدولة OLSS قابلة للتدريب لتحسين الكفاءة.
  - الريبو الأصلي لـ OLSS موجود هنا.
  - تم إصدار التقرير الفني (CIKM 2023) على arXiv.
  - يتم عرض فيديو تجريبي على Bilibili.
  - نظرًا لأن OLSS يتطلب تدريبًا إضافيًا، فإننا لا نقوم بتنفيذه في هذا المشروع.
29 أغسطس 2023. نقترح DiffSynth، وهو إطار عمل لتركيب الفيديو.
- صفحة المشروع.
- يتم إصدار أكواد المصدر في EasyNLP.
- تم إصدار التقرير الفني (ECML PKDD 2024) على arXiv.

تثبيت

التثبيت من الكود المصدري (مستحسن):

 git clone https://github.com/modelscope/DiffSynth-Studio.git
cd DiffSynth-Studio
pip install -e .

أو التثبيت من pypi:

 pip install diffsynth

الاستخدام (في كود بايثون)

أمثلة بايثون موجودة في examples . نحن نقدم لمحة عامة هنا.

تنزيل النماذج

قم بتنزيل النماذج المحددة مسبقًا. يمكن العثور على معرفات النموذج في ملف التكوين.

 from diffsynth import download_models

download_models ([ "FLUX.1-dev" , "Kolors" ])

قم بتنزيل النماذج الخاصة بك.

 from diffsynth . models . downloader import download_from_huggingface , download_from_modelscope

# From Modelscope (recommended)
download_from_modelscope ( "Kwai-Kolors/Kolors" , "vae/diffusion_pytorch_model.fp16.bin" , "models/kolors/Kolors/vae" )
# From Huggingface
download_from_huggingface ( "Kwai-Kolors/Kolors" , "vae/diffusion_pytorch_model.fp16.safetensors" , "models/kolors/Kolors/vae" )

تركيب الفيديو

تحويل النص إلى فيديو باستخدام CogVideoX-5B

تم إصدار CogVideoX-5B بواسطة ZhiPu. نحن نقدم خط أنابيب محسنًا، يدعم تحويل النص إلى فيديو، وتحرير الفيديو، والترقية الذاتية، واستيفاء الفيديو. examples/video_synthesis

يتم إنشاء الفيديو الموجود على اليسار باستخدام مسار تحويل النص إلى فيديو الأصلي، بينما يكون الفيديو الموجود على اليمين هو النتيجة بعد التحرير واستيفاء الإطار.

cogvideo.mp4

تركيب الفيديو الطويل

لقد قمنا بتدريب نماذج موسعة لتركيب الفيديو، والتي يمكنها إنشاء 128 إطارًا. examples/ExVideo

github_title.mp4

التجريبي.mp4

تظليل تون

قم بعرض مقاطع فيديو واقعية بأسلوب مسطح وتمكين ميزات تحرير الفيديو. examples/Diffutoon

ديفوتون.mp4

Diffutoon_edit.mp4

أسلوب الفيديو

تصميم الفيديو بدون نماذج فيديو. examples/diffsynth

Winter_stone.mp4

تركيب الصورة

توليد صور عالية الدقة، عن طريق كسر القيود المفروضة على نماذج الانتشار! examples/image_synthesis .

يتم دعم ضبط LoRA في examples/train .

تدفق	انتشار مستقر 3

كولورز	هونيوان-ديت

انتشار مستقر	انتشار مستقر XL

الاستخدام (في WebUI)

أنشئ صورًا مذهلة باستخدام الرسام بمساعدة الذكاء الاصطناعي!

video.mp4

لا يتم عرض هذا الفيديو في الوقت الحقيقي.

قبل تشغيل WebUI، يرجى تنزيل النماذج إلى المجلد ./models . انظر هنا.

نسخة Gradio

 pip install gradio

 python apps/gradio/DiffSynth_Studio.py

20240822102002

نسخة Streamlit

 pip install streamlit streamlit-drawable-canvas

 python -m streamlit run apps/streamlit/DiffSynth_Studio.py

sdxl_turbo_ui.mp4

يوسع

معلومات إضافية

الإصدار v1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2024-11-08
الحجم 50MB
من Github

تطبيقات ذات صلة

PwR Studio

2024-11-14
langgraph studio

2024-11-09
sam2 studio

2024-11-08
gb studio

2024-11-06
codefusion studio

2024-11-04
vpin studio

2024-11-04

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل