Des chercheurs de l'Université de Washington proposent une méthode innovante de réglage des agents qui optimise efficacement les grands modèles de langage sans nécessiter l'accès aux poids des modèles. Ce procédé guide les prédictions du modèle de base vers le modèle optimisé en comparant les prédictions d'un petit modèle optimisé et d'un modèle non optimisé, ce qui permet d'améliorer les performances du modèle et de mieux conserver les connaissances de formation. Cette technologie révolutionnaire a été vérifiée lors d’expériences de mise au point sur les modèles originaux 13B et 70B du LAMA-2, démontrant ainsi ses avantages significatifs en termes d’efficacité.
Webmaster Home a rapporté que l'Université de Washington a lancé une méthode de réglage par procuration qui permet de réaliser un réglage efficace de grands modèles sans toucher aux poids du modèle en comparant les résultats de prédiction de petits modèles ajustés et de modèles non ajustés. Cette méthode permet de mieux conserver les connaissances de formation pendant le décodage et d'améliorer l'efficacité du réglage. Les performances de réglage des agents ont été vérifiées par des chercheurs qui ont peaufiné les modèles originaux 13B et 70B de LlAMA-2. Cette méthode compare les distributions de prédiction de sortie du modèle de base M et du modèle de réglage M+, et guide les prédictions du modèle de base pour qu'elles évoluent dans la direction du modèle de réglage. La méthode de réglage des agents fournit une solution pour un réglage efficace des grands modèles tout en conservant mieux les connaissances de formation pendant le décodage, ce qui devrait apporter de nouvelles connaissances dans le domaine de l'IA.Cette nouvelle méthode fournit un moyen plus pratique et plus efficace pour le réglage de grands modèles, réduit le besoin de manipulation directe des poids du modèle et améliore efficacement les performances du modèle et les capacités de rétention des connaissances, ouvrant ainsi de nouvelles possibilités au développement du domaine de l'intelligence artificielle. À l’avenir, cette méthode devrait être appliquée à un réglage de modèles de langage à plus grande échelle, favorisant ainsi les progrès de la technologie de l’IA.