Este artigo apresenta o modelo de difusão ScaleLong proposto pela Sun Yat-sen University e outras equipes, que melhora a estabilidade do treinamento ao dimensionar a conexão de salto longo da UNet. A equipe de pesquisa conduziu uma análise aprofundada do princípio do treinamento acelerado pela operação de escala 1/√2 e propôs dois métodos, LS e CS, para aliviar efetivamente o problema de instabilidade durante o treinamento do modelo. O resultado desta pesquisa é de importância significativa para melhorar a estabilidade do modelo de difusão e fornece importante suporte técnico para a aplicação prática do modelo de difusão.
A Universidade Sun Yat-sen e outras equipes propuseram o modelo de difusão ScaleLong, que estabiliza o treinamento do modelo ao dimensionar a conexão de salto longo da UNet. Eles analisaram o princípio da operação de escala 1/√2 para acelerar o treinamento e aliviaram efetivamente a instabilidade no treinamento do modelo por meio dos métodos LS e CS. Estes métodos simples e eficazes são de grande importância para a estabilidade dos modelos de difusão.
A proposta do modelo ScaleLong e seus métodos relacionados trouxeram novos avanços para a estabilidade do treinamento do modelo de difusão e forneceram experiência e orientação valiosas para o desenvolvimento de modelos de difusão mais estáveis e eficientes no futuro. Estou ansioso para ver mais resultados de pesquisas baseadas nisso no futuro.