Les chercheurs de Microsoft ont publié un nouveau cadre d'IA appelé Auto Evol-Instruct qui peut automatiquement faire évoluer les ensembles de données de guidage sans aucune intervention humaine. Ceci est d’une grande importance pour améliorer la capacité des grands modèles de langage (LLM) à suivre des instructions complexes. Les méthodes évolutionnistes traditionnelles reposent sur des règles conçues artificiellement, inefficaces et difficiles à adapter aux nouvelles tâches. Auto Evol-Instruct, quant à lui, analyse automatiquement les instructions via les LLM, conçoit et optimise indépendamment les règles d'évolution, réalise un processus d'évolution automatisé et efficace et améliore considérablement la complexité et la diversité des ensembles de données.
Récemment, des chercheurs de Microsoft ont proposé un nouveau cadre d'IA appelé Auto Evol-Instruct, qui peut automatiquement faire évoluer les ensembles de données de guidage sans aucune intervention humaine.
Dans le domaine de l’intelligence artificielle, le développement de grands modèles linguistiques (LLM) est crucial, notamment pour améliorer la capacité de ces modèles à suivre des instructions détaillées. Les chercheurs ont étudié comment améliorer les ensembles de données utilisés pour former les LLM afin d'améliorer les performances et l'adaptabilité des modèles.
Les méthodes d'évolution traditionnelles telles qu'Evol-Instruct s'appuient sur des règles d'évolution spécifiées par des experts humains, ce qui est non seulement coûteux et long, mais nécessite également une refonte de la méthode lors de son adaptation à de nouvelles tâches. En revanche, Auto Evol-Instruct réalise le processus d'évolution automatisé en utilisant d'abord des LLM pour analyser les instructions d'entrée et concevoir indépendamment la méthode initiale des règles d'évolution. Par la suite, la méthode d'évolution est optimisée de manière itérative via des LLM d'optimisation pour identifier et résoudre les problèmes au cours du processus d'évolution afin de garantir la complexité et la stabilité des instructions d'évolution finales.
Auto Evol-Instruct utilise des LLM pour concevoir des méthodes d'évolution en analysant automatiquement les instructions d'entrée et en formulant des règles d'évolution, augmentant ainsi la complexité et la diversité des ensembles de données.
En termes d'évaluation des performances, Auto Evol-Instruct fonctionne bien dans plusieurs tests de référence. Par exemple, en affinant Mixtral-8x7B en utilisant uniquement 10 000 données ShareGPT évoluées, le framework a obtenu 8,09 points sur MT-Bench et 91,4 points sur AlpacaEval, surpassant GPT-3.5-Turbo et WizardLM-70B, et rivalisant avec Claude2.0. équivalent.
De plus, en utilisant uniquement 7K de données de formation GSM8K évoluées, le framework obtient 82,49 points sur GSM8K. En termes de génération de code, en affinant DeepSeek-Coder-Base-33B à l'aide de 20K Code Alpaca évolué, le framework obtient un score de 82,49 sur. HumanEval. Il a obtenu un score de 77,4, surpassant les autres modèles concurrents.
On peut constater que ce nouveau framework a obtenu de bons résultats dans plusieurs tests de référence, notamment MT-Bench, AlpacaEval, GSM8K et HumanEval, démontrant son potentiel pour améliorer les capacités de suivi des instructions, de raisonnement mathématique et de génération de code.
Adresse papier : https://arxiv.org/abs/2406.00770
Points forts:
Auto Evol-Instruct est un framework d'IA entièrement automatique qui peut automatiquement analyser et faire évoluer les ensembles de données de guidage sans intervention humaine.
Le cadre augmente efficacement la complexité et la diversité des ensembles de données en optimisant la méthode d'évolution, améliorant ainsi les performances et l'adaptabilité des LLM dans diverses tâches.
Les résultats d'Auto Evol-Instruct démontrent une méthode pour guider l'évolution des ensembles de données grâce à l'automatisation.
L'émergence du framework Auto Evol-Instruct marque une innovation majeure dans la méthode d'évolution des données de formation LLM. Ses fonctionnalités automatisées et efficaces favoriseront grandement le développement de LLM et fourniront un support solide pour la construction de modèles d'IA plus puissants et adaptables. Des articles pertinents ont été publiés et les lecteurs intéressés peuvent les étudier en profondeur.