Des chercheurs de l'Université Sun Yat-sen et d'autres chercheurs ont proposé une nouvelle méthode appelée ScaleLong pour résoudre le problème de stabilité lors de la formation du modèle de diffusion. Cette méthode atténue efficacement l'instabilité des fonctionnalités et améliore la robustesse du modèle aux perturbations d'entrée en effectuant des opérations de mise à l'échelle sur la connexion à saut long d'UNet. Les chercheurs ont proposé deux méthodes spécifiques d'ajustement du coefficient de mise à l'échelle : la méthode Learnable Scaling (LS) et la méthode Constant Scaling (CS), et ont analysé visuellement le rôle des caractéristiques et des paramètres dans le processus de formation du modèle, ainsi que l'effet du coefficient de mise à l'échelle sur la l'ampleur du gradient et l'impact de la stabilité des perturbations d'entrée. Cette recherche fournit de nouvelles idées pour améliorer la stabilité de la formation et la robustesse des modèles de diffusion.
L’article se concentre sur :
Des chercheurs de l'Université Sun Yat-sen et d'autres chercheurs ont proposé le modèle de diffusion ScaleLong et ont souligné que les opérations de mise à l'échelle sur la connexion à saut long d'UNet peuvent stabiliser la formation du modèle. Des recherches ont montré que la définition raisonnable du coefficient de mise à l'échelle peut atténuer l'instabilité des caractéristiques et améliorer la robustesse du modèle face aux perturbations d'entrée. Ils ont proposé la méthode Learnable Scaling (LS) et la méthode Constant Scaling (CS), grâce auxquelles les coefficients de mise à l'échelle peuvent être ajustés de manière adaptative pour stabiliser davantage la formation du modèle. Les caractéristiques et paramètres visuels jouent un rôle important dans le processus de formation du modèle, tandis que le coefficient d'échelle affecte l'ampleur du gradient et la stabilité des perturbations d'entrée.
Le modèle ScaleLong améliore efficacement la stabilité et la robustesse de la formation des modèles de diffusion en améliorant la connexion à saut long d'UNet et en combinant les méthodes Learnable Scaling et Constant Scaling, et fournit un support technique important pour l'application des modèles de diffusion. Les recherches futures pourront explorer davantage de meilleures stratégies de mise à l’échelle pour améliorer encore les performances du modèle.