Soporte inicial para Tora (https://github.com/alibaba/Tora)
Modelo convertido (incluido en el nodo de descarga automática):
https://huggingface.co/Kijai/CogVideoX-5b-Tora/tree/main
Esta semana ha habido algunas actualizaciones más importantes que probablemente afectarán algunos flujos de trabajo antiguos, especialmente el nodo de muestra que probablemente deba actualizarse (recrearse) si se produce un error.
Nuevas características:
Soporte inicial para la versión oficial I2V de CogVideoX: https://huggingface.co/THUDM/CogVideoX-5b-I2V
También necesita difusores 0.30.3
Se agregó soporte inicial para CogVideoX-Fun: https://github.com/aigc-apps/CogVideoX-Fun
Tenga en cuenta que si bien este puede hacer image2vid, este NO es el modelo oficial I2V todavía, aunque también debería lanzarse muy pronto.
Se agregó soporte experimental para onediff, lo que redujo el tiempo de muestreo en aproximadamente un 40 % para mí, alcanzando 4,23 s/it en 4090 con 49 fotogramas. Esto requiere el uso de Linux, torch 2.4.0, onediff y la instalación de nexfort:
pip install --pre onediff onediffx
pip install nexfort
La primera ejecución tardará unos 5 minutos en compilar.
El modelo 5b ahora también es compatible con text2vid básico: https://huggingface.co/THUDM/CogVideoX-5b
También se descarga automáticamente en ComfyUI/models/CogVideo/CogVideoX-5b
, no se necesita codificador de texto ya que usamos ComfyUI T5.
Requiere difusores 0.30.1 (esto se especifica en requisitos.txt)
Utiliza el mismo modelo T5 que SD3 y Flux, fp8 también funciona bien. Los requisitos de memoria dependen principalmente de la duración del vídeo. La decodificación VAE parece ser la única gran que requiere mucha VRAM cuando todo está descargado, alcanza un máximo momentáneo de alrededor de 13-14 GB en esa etapa. El muestreo en sí requiere sólo entre 5 y 6 GB.
Hackeado en img2img para intentar el flujo de trabajo vid2vid, funciona de manera interesante con algunas entradas, altamente experimental.
También se agregó mosaico temporal como medio para generar videos interminables:
https://github.com/kijai/ComfyUI-CogVideoXWrapper
Repositorio original: https://github.com/THUDM/CogVideo
CogVideoX-Fun: https://github.com/aigc-apps/CogVideoX-Fun
Controlnet: https://github.com/TheDenk/cogvideox-controlnet