El equipo de Colossal-AI ha abierto su último modelo de generación de vídeo, Open-Sora, que ha atraído una gran atención. Este modelo utiliza la arquitectura Diffusion Transformer para mejorar significativamente la calidad de la generación de video a través de un entrenamiento de múltiples etapas. Más importante aún, el equipo también proporciona scripts de preprocesamiento de datos convenientes y fáciles de usar, lo que reduce el umbral de usuario y permite que participen más desarrolladores.
El equipo de Colossal-AI lanzó Open-Sora de código abierto, que utiliza la arquitectura Diffusion Transformer para la generación de video y mejora la calidad mediante capacitación en múltiples etapas. El equipo de autores proporciona scripts de preprocesamiento de datos convenientes para reducir el umbral técnico. Open-Sora muestra excelentes efectos de generación de video y llama la atención.
El código abierto de Open-Sora aporta nuevas posibilidades al campo de la generación de vídeo. Su arquitectura eficiente y sus herramientas convenientes seguramente promoverán el desarrollo tecnológico y la innovación de aplicaciones en este campo. Esperamos que Open-Sora pueda desempeñar un papel en más escenarios en el futuro.