Начальная поддержка Tora (https://github.com/alibaba/Tora)
Конвертированная модель (включена в узел автозагрузки):
https://huggingface.co/Kijai/CogVideoX-5b-Tora/tree/main
На этой неделе было несколько более крупных обновлений, которые, скорее всего, повлияют на некоторые старые рабочие процессы, особенно узел сэмплера, вероятно, потребуется обновить (пересоздать), если произойдет ошибка!
Новые возможности:
Первоначальная поддержка официальной версии CogVideoX I2V: https://huggingface.co/THUDM/CogVideoX-5b-I2V
Также нужны диффузоры 0.30.3
Добавлена первоначальная поддержка CogVideoX-Fun: https://github.com/aigc-apps/CogVideoX-Fun.
Обратите внимание: хотя эта модель поддерживает image2vid, это еще НЕ официальная модель I2V, хотя она также должна быть выпущена очень скоро.
Добавлена экспериментальная поддержка onediff, это позволило мне сократить время выборки примерно на 40 %, достигнув 4,23 с/ит на 4090 с 49 кадрами. Для этого необходимо использовать Linux, torch 2.4.0, onediff и установку nexfort:
pip install --pre onediff onediffx
pip install nexfort
Компиляция первого запуска займет около 5 минут.
Модель 5b теперь также поддерживается для базового text2vid: https://huggingface.co/THUDM/CogVideoX-5b
Он также автоматически загружается в ComfyUI/models/CogVideo/CogVideoX-5b
, кодировщик текста не требуется, поскольку мы используем ComfyUI T5.
Требуются диффузоры 0.30.1 (это указано в require.txt)
Использует ту же модель T5, что и SD3 и Flux, fp8 тоже работает нормально. Требования к памяти в основном зависят от длины видео. Декодирование VAE, по-видимому, является единственным большим процессом, который требует много видеопамяти, когда все выгружено, и на этом этапе на мгновение достигает пика около 13-14 ГБ. Сама выборка занимает всего 5-6 ГБ.
Взломан в img2img, чтобы попробовать рабочий процесс vid2vid, интересно работает с некоторыми входными данными, очень экспериментальный.
Также добавлено временное тайлинг как средство создания бесконечных видео:
https://github.com/kijai/ComfyUI-CogVideoXWrapper
Исходное репо: https://github.com/THUDM/CogVideo.
CogVideoX-Fun: https://github.com/aigc-apps/CogVideoX-Fun
Сеть управления: https://github.com/TheDenk/cogvideox-controlnet.