Fini le réglage manuel ! Microsoft PromptWizard implémente une optimisation des invites à grande échelle, ce qui permet d'économiser du temps et des coûts !

Auteur：Eve Cole Date de mise à jour：2024-12-26 11:16:01

PromptWizard, le dernier outil open source publié par l'équipe de recherche Microsoft AI, fournit une nouvelle solution pour l'optimisation des mots d'invite du grand modèle de langage (LLM). Les méthodes traditionnelles d'optimisation des mots rapides prennent du temps et sont difficiles à développer. PromptWizard améliore considérablement les performances et l'efficacité du modèle en introduisant un mécanisme de rétroaction et en adoptant une stratégie d'optimisation itérative critique et complète. Il utilise LLM pour générer et évaluer plusieurs variantes de mots d'invite dans la phase de génération et assure une amélioration continue des performances dans la phase d'inférence de test. Il obtient finalement d'excellents résultats sur plusieurs ensembles de données et réduit considérablement la consommation de ressources.

Récemment, l'équipe de recherche de Microsoft en IA a publié l'outil open source PromptWizard, un cadre d'IA basé sur les commentaires conçu pour optimiser efficacement la conception rapide de grands modèles de langage (LLM). La qualité des indices est essentielle à la qualité des résultats du modèle. Toutefois, la création d'indices de haute qualité nécessite souvent beaucoup de temps et de ressources humaines, en particulier dans le cadre de tâches complexes ou spécifiques à un domaine.

Les méthodes traditionnelles d’optimisation rapide reposent principalement sur une expérience manuelle, qui prend non seulement du temps, mais est également difficile à développer. Les techniques d'optimisation existantes sont divisées en deux types : continue et discrète. Les techniques continues telles que les invites logicielles nécessitent des ressources informatiques étendues, tandis que les méthodes discrètes telles que PromptBreeder et EvoPrompt sont évaluées en générant plusieurs variantes d'invite. Bien que ces méthodes fonctionnent bien dans certains cas, elles manquent d'un mécanisme de rétroaction efficace, ce qui entraîne souvent des résultats. insatisfaisant.

PromptWizard améliore considérablement les performances des tâches en introduisant un mécanisme de rétroaction et en utilisant une approche critique et complète pour optimiser de manière répétée les instructions et les exemples d'invite. Son workflow est principalement divisé en deux étapes : l'étape de génération et l'étape d'inférence de test. Lors de la phase de génération, le système exploite un vaste modèle de langage pour générer plusieurs variantes des signaux sous-jacents et les évalue pour trouver des candidats très performants. Dans le même temps, le mécanisme de critique intégré au cadre analysera les avantages et les inconvénients de chaque invite et fournira des commentaires pour guider l'optimisation ultérieure. Après plusieurs cycles d'optimisation, le système peut améliorer la diversité et la qualité des invites.

Pendant la phase d'inférence de test, des conseils et des exemples optimisés sont appliqués aux nouvelles tâches pour garantir une amélioration continue des performances. Avec cette approche, PromptWizard mène des expériences approfondies sur 45 tâches et obtient d'excellents résultats dans des environnements non supervisés et supervisés. Par exemple, il atteint une précision non supervisée de 90 % sur l’ensemble de données GSM8K et de 82,3 % sur SVAMP. De plus, par rapport aux méthodes discrètes telles que PromptBreeder, PromptWizard réduit jusqu'à 60 fois les appels d'API et l'utilisation de jetons, démontrant ainsi son efficacité dans des environnements aux ressources limitées.

Le succès de PromptWizard réside dans son optimisation de séquence innovante, sa critique guidée et l'intégration de rôles d'experts, lui permettant de s'adapter efficacement à des tâches spécifiques et d'avoir une bonne interprétabilité. Ces progrès témoignent de l’importance des cadres d’automatisation dans les flux de travail de traitement du langage naturel et devraient promouvoir des applications plus efficaces et plus économiques des technologies avancées d’IA.

Blog : https://www.microsoft.com/en-us/research/blog/promptwizard-the-future-of-prompt-optimization-through-feedback-driven-self-evolving-prompts/

Code du projet : https://github.com/microsoft/PromptWizard?tab=readme-ov-file

Article : https://www.microsoft.com/en-us/research/publication/promptwizard-task-aware-agent-driven-prompt-optimization-framework/

Points forts:

PromptWizard est un nouveau framework d'IA utilisé pour optimiser les invites pour les grands modèles de langage et améliorer les performances des modèles.

Ce cadre combine des mécanismes de critique et des boucles de rétroaction pour générer et évaluer efficacement plusieurs variantes d'invite.

PromptWizard fait preuve d'une excellente précision dans plusieurs tâches et réduit considérablement la consommation et les coûts des ressources.

Dans l'ensemble, PromptWizard fournit un outil puissant pour l'optimisation des mots d'invite de modèles de langage à grande échelle grâce à des mécanismes innovants basés sur les commentaires et des stratégies d'optimisation efficaces. Son efficacité et sa précision lui confèrent des avantages significatifs dans les applications pratiques, fournissant un outil puissant pour l'IA. développement de la technologie. Les lecteurs intéressés peuvent visiter les liens fournis pour plus d’informations.