อัปเดต v0.2: แก้ไขโหนดผิดที่เชื่อมต่อกับโหนด florence2
อัปเดต 08-11-2024 : หลังจากเล่นซอไปสักพัก ฉันพบวิธีสร้างภาพคุณภาพสูงด้วย controlnet ตามที่สาธิตบนหน้า Github/HF ของพวกเขา ฉันยังพบว่าวิธีการสุ่มตัวอย่าง 2 วิธีสามารถรวมกันและจัดระเบียบใหม่ได้ ด้วยแนวทางที่ง่ายกว่าและมีประสิทธิภาพมากขึ้น ฉันจะอัปเดต v0.3 เร็วๆ นี้เพื่อรวมการเปลี่ยนแปลงทั้งหมดนี้
ฉันได้สร้างเวิร์กโฟลว์ All-in-One FluxDev ใน ComfyUI ที่ผสมผสานเทคนิคต่างๆ สำหรับการสร้างภาพด้วยโมเดล FluxDev รวมถึง img-to-img และ text-to-img เวิร์กโฟลว์นี้สามารถใช้ LoRA, ControlNets, เปิดใช้งานการแจ้งเตือนเชิงลบด้วย Ksampler, การกำหนดเกณฑ์แบบไดนามิก, การลงสี และอื่นๆ โปรดทราบว่านี่ไม่ใช่วิธีที่ "ถูกต้อง" ในการใช้เทคนิคเหล่านี้ แต่เป็นการตีความส่วนตัวของฉันตามข้อมูลที่มีอยู่
ใช้งานโหนด USE ทุกที่อย่างหนัก
เวิร์กโฟลว์นี้อาศัยโหนด USE Everywhere อย่างมากเพื่อให้สะอาดและมีประสิทธิภาพมากที่สุดเท่าที่จะเป็นไปได้สำหรับความต้องการในการสร้างรายวันของฉัน ฉันกำลังแชร์ขั้นตอนการทำงานนี้กับชุมชนเพื่อรวบรวมข้อมูลเชิงลึกและข้อเสนอแนะสำหรับการปรับปรุง รู้สึกอิสระที่จะทดลองด้วยตัวคุณเอง
ComfyUI/models/clip
): flux_text_encodersae.sft
ใน ComfyUI/models/vae
): ae.safetensorsComfyUI/models/controlnet
เปิดโฟลเดอร์หากจำเป็น)ComfyUI/models/loras
เปิดโฟลเดอร์หากจำเป็น)การตั้งค่า VRAM ต่ำ:
เรียกใช้ ComfyUI ด้วยอาร์กิวเมนต์ "--lowvram" (เพิ่มลงในไฟล์ .bat ของคุณ) เพื่อถ่ายข้อมูลตัวเข้ารหัสข้อความไปยัง CPU
ในขณะที่สร้างเวิร์กโฟลว์นี้ มี ControlNet สองรายการและ LoRA หลายรายการ รวมถึง:
ฉันเพิ่งทดสอบ Canny และ Realism LoRA จาก XLabs-AI เท่านั้น และนี่คือประเด็นสำคัญบางประการ:
git checkout xlabs_flux_controlnet
เวิร์กโฟลว์ Ksampler พร้อมการกำหนดขีดจำกัดแบบไดนามิกนั้นอิงตามโพสต์ในบล็อก ComfyUI อย่างเป็นทางการ และฉันพูดว่า:
หมายเหตุสำหรับทั้งสองรุ่น คุณสามารถใช้ SamplerCustomAdvanced
กับ BasicGuider
หรือหากคุณใช้ KSampler
ให้ตั้งค่า CFG
เป็น 1
คุณสามารถใช้ FluxGuidance
ใหม่บนโมเดล Dev เพื่อควบคุมค่าที่คล้าย CFG ที่กลั่นแล้ว (แนะนำให้ตั้งค่านี้เป็น 2 เพื่อความสมจริงหรือการควบคุมสไตล์ที่ดีกว่า) โมเดลเหล่านี้ได้รับการฝึกฝนให้ทำงานโดยไม่ต้องใช้ CFG จริง ไม่ได้หมายความว่าคุณไม่สามารถใช้ CFG ได้ ที่จริงแล้ว ชุมชนได้ใช้ประโยชน์จาก ComfyUI อย่างรวดเร็วในฐานะแพลตฟอร์มทดลองเพื่อทดสอบเทคนิคต่างๆ มากมายเพื่อให้ได้ประโยชน์สูงสุดจากโมเดลใหม่ (เช่น การใช้โหนดแบบกำหนดเอง Dynamic Thresholding หรือใช้โหนดในตัว FluxGuidance
ใหม่เพื่อชดเชย และเปิดใช้งาน CFG และการแจ้งเตือนเชิงลบ นอกจากนี้ยังมี ModelSamplingFlux
ในตัวเพื่อควบคุม Flux sigma shift แม้ว่าประโยชน์ของมันจะมีจำกัดมากกว่าก็ตาม)
โปรดทราบว่านี่เป็นการตีความของฉันเอง และอย่าลังเลที่จะทำการเปลี่ยนแปลงและทดลองใดๆ
การสาธิตการเก็บตัวอย่างที่ไม่ใช่เชอร์รี่ 0 ช็อต ด้วยวิธีการสุ่มตัวอย่างนี้:
คุณสามารถค้นหา repo ได้ที่นี่
เครื่องคำนวณความละเอียดพิกเซลเป็นโหนดแบบกำหนดเองที่ฉันพัฒนาด้วยความช่วยเหลือของ LLama3.1 เมื่อวานนี้ (ใช่ ฉันไม่มีทักษะในการเขียนโปรแกรม กำลังเรียนรู้ตั้งแต่เริ่มต้น) มันเป็นเพียงโหนดง่ายๆ ที่สร้างความละเอียดพิกเซล "ที่เป็นมิตรแฝง" ที่ใกล้เคียงที่สุดจากล้านพิกเซลและอัตราส่วนภาพที่คุณเลือก ฉันได้รับแรงบันดาลใจจากโหนด ImageScaleToTotalPixels จากเวิร์กโฟลว์สาธิต Flux ดั้งเดิม เนื่องจากทุกคนดูเหมือนจะพูดถึงความละเอียดพิกเซล แทนที่จะพูดถึงจำนวนพิกเซลความกว้างและความสูงเหมือนใน SDXL นอกจากนี้ยังมีโหนดสำหรับแปลงอินพุตตัวอย่างแฝงเป็นจำนวนพิกเซลความกว้างและความสูง
รวมถึงเวิร์กโฟลว์การอัปสเกลด้วย โดยจะใช้โหนด Iterative Upscale (รูปภาพ) จาก Impact Pack และการกระจายแบบเรียงต่อกันเพื่อสร้างการแก้ไขที่มีความละเอียดสูง เช่น การอัปสเกลและการทำรายละเอียดกลุ่มโหนดด้วยโมเดลการอัปสเกลที่คุณเลือก คุณยังสามารถทำการ Denoise, CFG และการจัดกำหนดการขั้นตอนด้วยตะขอ PK
ภาพสาธิตเปรียบเทียบที่นี่
เนื่องจากยังไม่มีโมเดลการลงสีที่ได้รับการฝึกฝนสำหรับ Flux จึงมีเพียงรูปแบบการลงสีที่ง่ายที่สุดเท่านั้นที่สามารถทำได้ที่นี่ คุณยังสามารถลองรวม ControlNets เข้าด้วยกันได้ แต่ให้ใส่ใจกับความละเอียดแบบสี่เหลี่ยมจัตุรัสและมาตราส่วนคำแนะนำ (4)
มีเพียงโหนดง่าย ๆ บางตัวในการรัน ollama และ Florence2 เพื่อใช้ Vision LLm สำหรับคำบรรยายรายละเอียดและเพื่อรับข้อมูลเชิงลึกที่รวดเร็ว ฉันใช้ LLaVa 13B และ Florence2 ขนาดใหญ่ในการสาธิต คุณจะต้องมีโหนด Ollama , Ollama ComfyUI และ Florence2 ComfyUI ดูลิงก์ เพื่อดูรายละเอียดการใช้งานและคู่มือการติดตั้ง
จะมีการเพิ่มคำแนะนำโดยละเอียดเพิ่มเติมหากผู้คนพบว่ามันใช้งานยาก....
Flux เป็นโมเดลที่ยืดหยุ่นมาก และเนื่องจากเป็นเวอร์ชัน 1 จึงน่าประทับใจมาก ภายในสองสัปดาห์หลังการเปิดตัว ก็จะมี ControlNets และ LoRA พร้อมให้บริการแล้ว ซึ่งแสดงให้เห็นว่าชุมชนชื่นชอบโมเดลนี้มากเพียงใด ตอนนี้ฉันกำลังตั้งตาคอยโมเดลในการวาดภาพบางแบบ และที่สำคัญที่สุด Matteo โปรดปล่อย iPadapter สำหรับ Flux หน่อย.... ได้โปรด ปริศนาที่หายไปอันหนึ่งก็เสร็จแล้ว....
มีความสุขในการสร้าง!
ป.ล. ฉันกำลังรวมพรอมต์ที่ฉันใช้กับ LLama3.1 เพื่อช่วยฉันตรวจสอบการสะกดและตรวจไวยากรณ์สำหรับ repo นี้โดยไม่มีเหตุผล:
ทำหน้าที่เป็นนักเขียนมืออาชีพที่มีทักษะการเขียนที่แข็งแกร่งและมีความเข้าใจอย่างลึกซึ้งในการเขียนโดยทั่วไป ช่วยเหลือผู้ใช้ในการเขียนใหม่ การจัดรูปแบบใหม่ และดำเนินการตรวจสอบไวยากรณ์และการสะกดคำเมื่อมีการร้องขอ งานของคุณควรประกอบด้วย:
นอกจากนี้ โปรด:
คุณเข้าใจข้อกำหนดเหล่านี้หรือไม่?