การสนับสนุนเบื้องต้นสำหรับ Tora (https://github.com/alibaba/Tora)
โมเดลที่แปลงแล้ว (รวมอยู่ในโหนดดาวน์โหลดอัตโนมัติ):
https://huggingface.co/Kijai/CogVideoX-5b-Tora/tree/main
สัปดาห์นี้มีการอัปเดตที่ใหญ่กว่าซึ่งน่าจะส่งผลต่อเวิร์กโฟลว์เก่าบางรายการ โดยเฉพาะอย่างยิ่งโหนดตัวอย่างอาจจำเป็นต้องรีเฟรช (สร้างใหม่) หากเกิดข้อผิดพลาด!
คุณสมบัติใหม่:
การสนับสนุนเบื้องต้นสำหรับ CogVideoX เวอร์ชัน I2V อย่างเป็นทางการ: https://huggingface.co/THUDM/CogVideoX-5b-I2V
ต้องการตัวกระจายสัญญาณ 0.30.3 ด้วย
เพิ่มการสนับสนุนเบื้องต้นสำหรับ CogVideoX-Fun: https://github.com/aigc-apps/CogVideoX-Fun
โปรดทราบว่าแม้ว่ารุ่นนี้จะสามารถทำ image2vid ได้ แต่นี่ไม่ใช่รุ่น I2V อย่างเป็นทางการ แม้ว่าจะควรจะออกในเร็วๆ นี้ก็ตาม
เพิ่มการสนับสนุน การทดลอง สำหรับ onediff ซึ่งลดเวลาการสุ่มตัวอย่างลง ~40% สำหรับฉัน โดยอยู่ที่ 4.23 วินาที/ครั้งบน 4090 ด้วย 49 เฟรม สิ่งนี้ต้องใช้การติดตั้ง Linux, torch 2.4.0, onediff และ nextfort:
pip install --pre onediff onediffx
pip install nexfort
การรันครั้งแรกจะใช้เวลาประมาณ 5 นาทีในการรวบรวม
ขณะนี้โมเดล 5b ได้รับการสนับสนุนสำหรับ text2vid พื้นฐานแล้ว: https://huggingface.co/THUDM/CogVideoX-5b
นอกจากนี้ยังดาวน์โหลดอัตโนมัติไปยัง ComfyUI/models/CogVideo/CogVideoX-5b
ไม่จำเป็นต้องใช้ตัวเข้ารหัสข้อความเนื่องจากเราใช้ ComfyUI T5
ต้องใช้ตัวกระจาย 0.30.1 (ระบุไว้ใน Requirements.txt)
ใช้รุ่น T5 เดียวกันกับ SD3 และ Flux fp8 ก็ทำงานได้ดีเช่นกัน ข้อกำหนดหน่วยความจำขึ้นอยู่กับความยาวของวิดีโอเป็นส่วนใหญ่ ดูเหมือนว่าการถอดรหัส VAE จะเป็นสิ่งเดียวที่ใหญ่ซึ่งใช้ VRAM จำนวนมากเมื่อทุกอย่างถูกออฟโหลด โดยจะสูงสุดที่ประมาณ 13-14GB ชั่วขณะหนึ่งในช่วงนั้น การสุ่มตัวอย่างจะใช้เวลาเพียง 5-6GB เท่านั้น
ถูกแฮ็กใน img2img เพื่อลองใช้เวิร์กโฟลว์ vid2vid ทำงานได้อย่างน่าสนใจกับอินพุตบางส่วน เป็นการทดลองระดับสูง
เพิ่มการปูกระเบื้องชั่วคราวเพื่อสร้างวิดีโอที่ไม่มีที่สิ้นสุด:
https://github.com/kijai/ComfyUI-CogVideoXWrapper
แหล่งซื้อคืนดั้งเดิม: https://github.com/THUDM/CogVideo
CogVideoX-สนุก: https://github.com/aigc-apps/CogVideoX-Fun
คอนโทรลเน็ต: https://github.com/TheDenk/cogvideox-controlnet