Página del proyecto | arxiv
Los modelos de lenguaje grande (LLM) han hecho un progreso impresionante en el procesamiento del lenguaje natural. Estos modelos dependen de las instrucciones (o indicaciones) humanas adecuadas para generar respuestas adecuadas. Sin embargo, el potencial de los LLM no se aprovechan por completo con los métodos de incrustación de uso común:
Proponemos EVOCE, un marco automático de refinamiento rápido . En EVOKE, hay dos instancias de un mismo LLM: a) uno como revisor (LLM-Reviewer), obtiene el aviso actual; b) El otro como autor (Autor LLM), edita el mensaje al considerar el historial de edición y los comentarios del revisor.
Tal circuito de retroalimentación de autor de autor garantiza que el aviso se refine en cada iteración. Agregamos aún más un enfoque de selección de datos para evocar, donde solo las muestras duras están expuestas al LLM. Las muestras duras son más importantes porque el LLM puede desarrollar una comprensión más profunda de las tareas de ellas, mientras que el modelo ya puede saber cómo resolver los casos más fáciles. Los resultados experimentales muestran que evoca un rendimiento significativo superan los métodos existentes.
¡Más detalles pronto , incluido el patio de recreo!
Este proyecto da la bienvenida a las contribuciones y sugerencias. La mayoría de las contribuciones requieren que acepte un Acuerdo de Licencia de Contributor (CLA) que declare que tiene derecho y realmente hacernos los derechos para utilizar su contribución. Para más detalles, visite https://cla.opensource.microsoft.com.
Cuando envíe una solicitud de extracción, un BOT CLA determinará automáticamente si necesita proporcionar un CLA y decorar el PR de manera adecuada (por ejemplo, verificación de estado, comentario). Simplemente siga las instrucciones proporcionadas por el bot. Solo necesitará hacer esto una vez en todos los reposos usando nuestro CLA.
Este proyecto ha adoptado el Código de Conducta Open Open Microsoft. Para obtener más información, consulte el Código de Conducta Preguntas frecuentes o comuníquese con [email protected] con cualquier pregunta o comentario adicional.
Este proyecto puede contener marcas comerciales o logotipos para proyectos, productos o servicios. El uso autorizado de marcas o logotipos de Microsoft está sujeto y debe seguir las pautas de marca y marca de Microsoft. El uso de marcas registradas de Microsoft o logotipos en versiones modificadas de este proyecto no debe causar confusión o implicar el patrocinio de Microsoft. Cualquier uso de marcas comerciales o logotipos de terceros está sujeto a las políticas de esas partes de terceros.