Este artículo presenta el modelo de difusión ScaleLong propuesto por la Universidad Sun Yat-sen y otros equipos, que mejora la estabilidad del entrenamiento al escalar la conexión de salto largo de UNet. El equipo de investigación realizó un análisis en profundidad del principio de entrenamiento acelerado mediante la operación de escala 1/√2 y propuso dos métodos, LS y CS, para aliviar eficazmente el problema de inestabilidad durante el entrenamiento del modelo. El resultado de esta investigación es de gran importancia para mejorar la estabilidad del modelo de difusión y proporciona un importante apoyo técnico para la aplicación práctica del modelo de difusión.
La Universidad Sun Yat-sen y otros equipos propusieron el modelo de difusión ScaleLong, que estabiliza el entrenamiento del modelo escalando la conexión de salto largo de UNet. Analizaron el principio de la operación de escala 1/√2 para acelerar el entrenamiento y aliviaron efectivamente la inestabilidad en el entrenamiento del modelo mediante métodos LS y CS. Estos métodos simples y efectivos son de gran importancia para la estabilidad de los modelos de difusión.
La propuesta del modelo ScaleLong y sus métodos relacionados ha aportado nuevos avances en la estabilidad del entrenamiento del modelo de difusión y ha proporcionado una valiosa experiencia y dirección para el desarrollo de modelos de difusión más estables y eficientes en el futuro. Esperamos ver más resultados de investigaciones basadas en esto en el futuro.