Page du projet | arxiv
Les modèles de grands langues (LLM) ont fait des progrès impressionnants dans le traitement du langage naturel. Ces modèles reposent sur des instructions (ou des invites) humaines appropriées pour générer des réponses appropriées. Cependant, le potentiel des LLM n'est pas entièrement exploité par des méthodes d'incitation couramment utilisées:
Nous proposons Evoke, un cadre de raffinement rapide automatique . Dans Evoke, il y a deux cas d'un même LLM: a) un en tant que réviseur (LLM-Reviewer), il marque l'invite actuelle; b) l'autre en tant qu'auteur (auteur LLM), il modifie l'invite en considérant l'historique d'édition et les commentaires du critique.
Une telle boucle de rétroaction auteur-revue garantit que l'invite est affinée dans chaque itération. Nous agrégeons davantage une approche de sélection des données pour évoquer, où seuls les échantillons durs sont exposés au LLM. Les échantillons durs sont plus importants car le LLM peut développer une compréhension plus approfondie des tâches, tandis que le modèle peut déjà savoir comment résoudre les cas les plus faciles. Les résultats expérimentaux montrent que l'évocation surpasse considérablement les méthodes existantes.
Plus de détails à venir bientôt , y compris le terrain de jeu!
Ce projet accueille les contributions et les suggestions. La plupart des contributions vous obligent à accepter un accord de licence de contributeur (CLA) déclarant que vous avez le droit de faire et en fait, accordez-nous les droits d'utilisation de votre contribution. Pour plus de détails, visitez https://cla.opensource.microsoft.com.
Lorsque vous soumettez une demande de traction, un bot CLA déterminera automatiquement si vous devez fournir un CLA et décorer le RP de manière appropriée (par exemple, vérification d'état, commentaire). Suivez simplement les instructions fournies par le bot. Vous n'aurez besoin de le faire qu'une seule fois sur tous les dépositions en utilisant notre CLA.
Ce projet a adopté le code de conduite open source Microsoft. Pour plus d'informations, consultez le code de conduite FAQ ou contactez [email protected] avec toute question ou commentaire supplémentaire.
Ce projet peut contenir des marques ou des logos pour des projets, des produits ou des services. L'utilisation autorisée de marques ou de logos Microsoft est soumise et doit suivre les directives de marque et de marque de Microsoft. L'utilisation de marques ou de logos de Microsoft dans des versions modifiées de ce projet ne doit pas provoquer de confusion ou impliquer le parrainage de Microsoft. Toute utilisation de marques ou de logos tiers est soumis aux politiques de ces tiers.