تم تحديث الإصدار 0.2: تم إصلاح العقد الخاطئة التي تتصل بعقدة florence2
تحديث 11-08-2024 : بعد قليل من العبث، وجدت طريقة لإعادة إنتاج الصورة عالية الجودة باستخدام شبكة التحكم كما تظهر على صفحة Github/HF الخاصة بهم، واكتشفت أيضًا أنه يمكن دمج طريقتي أخذ العينات وإعادة تنظيمهما في بطريقة أبسط وأكثر كفاءة، سأقوم بتحديث الإصدار 0.3 قريبًا ليشمل كل هذه التغييرات.
لقد قمت بإنشاء سير عمل All-in-One FluxDev في ComfyUI الذي يجمع بين تقنيات مختلفة لإنشاء الصور باستخدام نموذج FluxDev، بما في ذلك img-to-img وtext-to-img. يمكن لسير العمل هذا استخدام LoRAs وControlNets وتمكين المطالبة السلبية باستخدام Ksampler والعتبة الديناميكية والرسم الداخلي والمزيد. يرجى ملاحظة أن هذه ليست الطريقة "الصحيحة" لاستخدام هذه التقنيات، بل هو تفسيري الشخصي بناءً على المعلومات المتاحة.
الاستخدام المكثف لعقدة الاستخدام في كل مكان
يعتمد سير العمل هذا بشكل كبير على عقدة USE Everywhere لجعلها نظيفة وفعالة قدر الإمكان لتلبية احتياجاتي اليومية من الأجيال. أشارك سير العمل هذا مع المجتمع لجمع الأفكار والاقتراحات للتحسين. لا تتردد في التجربة بنفسك.
ComfyUI/models/clip
):flux_text_encodersae.sft
في ComfyUI/models/vae
): ae.safetensorsComfyUI/models/controlnet
، وافتح المجلد إذا لزم الأمر)ComfyUI/models/loras
، وافتح المجلد إذا لزم الأمر)إعداد VRAM منخفض:
قم بتشغيل ComfyUI باستخدام الوسيطة "--lowvram" (أضف إلى ملف .bat الخاص بك) لإلغاء تحميل برنامج تشفير النص إلى وحدة المعالجة المركزية
في وقت إنشاء سير العمل هذا، هناك شبكتا تحكم متاحتان والعديد من LoRAs، بما في ذلك:
لقد قمت فقط باختبار Canny وRealism LoRAs من XLabs-AI، وإليك بعض النقاط الرئيسية:
git checkout xlabs_flux_controlnet
يعتمد سير عمل Ksampler ذو العتبة الديناميكية على منشور مدونة ComfyUI الرسمي. وأنا أقتبس:
لاحظ أنه بالنسبة لكلا الطرازين، يمكنك إما استخدام SamplerCustomAdvanced
مع BasicGuider
، أو إذا كنت تستخدم KSampler
، فاضبط CFG
على 1
. يمكنك استخدام FluxGuidance
الجديد في نموذج Dev للتحكم في القيمة المقطرة المشابهة لـ CFG. (يوصى بضبط هذا على 2 لتحقيق الواقعية أو التحكم بشكل أفضل في الأسلوب) تم تدريب هذه النماذج على العمل بدون CFG حقيقي. هذا لا يعني أنه لا يمكنك أبدًا استخدام CFG - في الواقع، استفاد المجتمع بسرعة من ComfyUI كمنصة تجريبية لاختبار مجموعة واسعة من الحيل لتحقيق أقصى استفادة من النماذج الجديدة. (مثل استخدام العقدة المخصصة لـ Dynamic Thresholding، أو استخدام عقدة FluxGuidance
المضمنة الجديدة للتعويض وتمكين CFG والمطالبة السلبية. هناك أيضًا ModelSamplingFlux
مدمج للتحكم في تحول Flux sigma، على الرغم من أن فوائده محدودة أكثر.)
ضع في اعتبارك أن هذا هو تفسيري الخاص ولا تتردد في إجراء أي تغييرات أو تجربة.
0 عرض توضيحي غير اختيار الكرز باستخدام طريقة أخذ العينات هذه:
يمكنك العثور على الريبو هنا .
حاسبة دقة البكسل هي عقدة مخصصة قمت بتطويرها بمساعدة LLama3.1 بالأمس (نعم، ليس لدي أي مهارات برمجية، وأتعلمها في الطريق من الصفر). إنها مجرد عقدة بسيطة جدًا تولد أقرب دقة بكسل "صديقة للكامنة" من ميغابيكسل ونسبة العرض إلى الارتفاع التي تختارها. لقد استلهمت من عقدة ImageScaleToTotalPixels من سير العمل التجريبي الأصلي لـ Flux، حيث يبدو أن الجميع يتحدثون عن دقة البكسل بدلاً من عدد وحدات البكسل للعرض والارتفاع كما هو الحال في SDXL. توجد أيضًا عقدة لتحويل مدخلات العينة الكامنة إلى عدد وحدات البكسل للعرض والارتفاع.
يتم أيضًا تضمين سير عمل الارتقاء. يستخدم عقدة الترقية التكرارية (الصورة) من حزمة Impact والانتشار المتجانب لإنشاء إصلاح عالي الدقة مثل الارتقاء وتفصيل مجموعة العقد مع النموذج الراقي الذي تختاره. يمكنك أيضًا إجراء تقليل الضوضاء وCFG وجدولة الخطوات باستخدام خطاف PK.
الصورة التجريبية مقارنة هنا.
نظرًا لعدم وجود نموذج للرسم الداخلي تم تدريبه على Flux، فلا يمكن تحقيق هنا سوى أبسط شكل من أشكال الرسم الداخلي. يمكنك أيضًا محاولة دمج ControlNets، ولكن انتبه إلى مقياس الدقة والتوجيه المربع (4) .
فقط بعض العقد البسيطة لتشغيل ollama و Florence2 لاستخدام Vision LLm للتسميات التوضيحية التفصيلية وللحصول على رؤى سريعة، أنا أستخدم LLaVa 13B و Florence2 كبير في العرض التوضيحي، ستحتاج إلى عقد Ollama و Ollama ComfyUI و Florence2 ComfyUI، راجع الروابط للحصول على دليل الاستخدام والتثبيت التفصيلي.
ستتم إضافة دليل أكثر تفصيلاً إذا وجد الأشخاص صعوبة في استخدامه....
يعد Flux نموذجًا مرنًا، ونظرًا لأنه إصدار أول، فهو مثير للإعجاب للغاية. وفي غضون أسبوعين من الإصدار، تتوفر بالفعل شبكات ControlNets وLoRAs، مما يوضح مدى حب المجتمع لهذا النموذج. أنا الآن أتطلع إلى بعض نماذج inpainting. والأهم من ذلك، ماتيو، من فضلك قم بإصدار iPadapter لـ Flux.... من فضلك، اللغز الوحيد المفقود وأنا مكتمل....
توليد سعيد!
ملاحظة: أقوم بتضمين الموجه الذي أستخدمه مع LLama3.1 لمساعدتي في إجراء عمليات التدقيق الإملائي والتدقيق النحوي لهذا الريبو دون أي سبب:
العمل ككاتب محترف يتمتع بمجموعة مهارات كتابية قوية وفهم عميق للكتابة بشكل عام. مساعدة المستخدمين في إعادة الكتابة وإعادة التنسيق وإجراء التدقيق النحوي والإملائي عند الطلب. يجب أن تتضمن مهامك ما يلي:
بالإضافة إلى ذلك، يرجى:
هل تفهم هذه المتطلبات؟