Informes del editor de Downcodes: El equipo creativo de Alimama ha lanzado un nuevo modelo de generación de imágenes FLUX.1-Turbo-Alpha, que es un modelo Lora destilado de 8 pasos basado en el entrenamiento del modelo FLUX.1-dev. Este modelo utiliza un discriminador de cabezales múltiples, lo que mejora significativamente la calidad de la generación de imágenes. Admite múltiples funciones, como generación de texto a imagen, red de control de reparación, etc., y es compatible con los marcos Difusores y ComfyUI, lo que lo hace. fácil para los usuarios comenzar rápidamente. El modelo se entrena de manera adversa con millones de datos de imágenes de alta calidad. La puntuación estética supera los 6,3 y la resolución es superior a 800, lo que garantiza una salida de imágenes de alta calidad. Lo que es aún más emocionante es que en el futuro se lanzará una versión con escalones más bajos.
Recientemente, el equipo creativo de Alimama lanzó FLUX.1-Turbo-Alpha, un modelo Lora de destilación de 8 pasos entrenado en base al modelo FLUX.1-dev.
Este modelo utiliza un discriminador de cabezales múltiples, que mejora significativamente la calidad de la destilación y admite una variedad de aplicaciones relacionadas con FLUX, como la generación de texto a imagen y redes de control de reparación. El equipo recomienda configurar la escala guía en 3,5 y la escala Lora en 1 cuando se utilice. En el futuro se lanzará una versión con un número menor de pasos.
FLUX.1-Turbo-Alpha se puede utilizar directamente con la estructura de los Difusores. Los usuarios pueden cargar el modelo y generar las imágenes requeridas con solo unas pocas líneas de código. Por ejemplo, podrías crear una escena divertida de un perezoso sonriente con una chaqueta de cuero, un sombrero de vaquero, una falda a cuadros y un lazo, parado frente a una elegante camioneta Volkswagen pintada con un paisaje urbano. Simplemente ajustando los parámetros, puede generar imágenes de alta calidad con una resolución de 1024x1024.
Además, el modelo también es compatible con ComfyUI y se puede utilizar para flujos de trabajo rápidos de texto a imagen o para lograr efectos de generación más eficientes en redes de control de reparación. A través de esta tecnología, las imágenes generadas pueden seguir de cerca la salida original, mejorando la experiencia creativa del usuario.
El proceso de formación de FLUX.1-Turbo-Alpha es igualmente impresionante. El modelo se entrenó con más de 1 millón de imágenes de código abierto y fuentes internas, con una puntuación estética de más de 6,3, todas con resoluciones superiores a 800. El equipo adoptó un método de entrenamiento adversario durante el proceso de entrenamiento para mejorar la calidad de la imagen y agregó un diseño de múltiples cabezales para cada capa del transformador. La escala de arranque durante el entrenamiento se fijó en 3,5, el desplazamiento de tiempo se estableció en 3, se utilizó precisión mixta bf16, la tasa de aprendizaje se estableció en 2e-5, el tamaño del lote fue 64 y el tamaño de la imagen fue 1024x1024.
El lanzamiento de FLUX.1-Turbo-Alpha marca otro avance para Alimama en el campo de la generación de imágenes, promoviendo la popularización y aplicación de la tecnología de inteligencia artificial.
Entrada del proyecto: https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha
Destacar:
Este modelo se basa en FLUX.1-dev y utiliza destilación de 8 pasos y discriminador de cabezales múltiples para mejorar la calidad de la generación de imágenes.
Al admitir redes de control de reparación y generación de texto a imagen, los usuarios pueden crear fácilmente una variedad de escenas interesantes.
El proceso de capacitación utiliza entrenamiento adversario y los datos de entrenamiento superan el millón de imágenes para garantizar una salida de alta calidad del modelo.
Con todo, FLUX.1-Turbo-Alpha aporta nuevas posibilidades al campo de la generación de imágenes con su alta eficiencia, capacidades de generación de imágenes de alta calidad y funciones convenientes y fáciles de usar. Los usuarios interesados pueden ir a la página Hugging Face para experimentar este poderoso modelo. El editor de Downcodes seguirá prestando atención a los últimos avances de Alibaba en el campo de la inteligencia artificial y les brindará informes más interesantes.