PromptWizard, la última herramienta de código abierto lanzada por el equipo de investigación de IA de Microsoft, proporciona una nueva solución para la optimización de palabras rápidas en modelos de lenguaje grande (LLM). Los métodos tradicionales de optimización de palabras rápidas consumen mucho tiempo y son difíciles de expandir. PromptWizard mejora significativamente el rendimiento y la eficiencia del modelo al introducir un mecanismo de retroalimentación y adoptar una estrategia de optimización iterativa crítica e integral. Utiliza LLM para generar y evaluar múltiples variantes de palabras clave en la fase de generación, lo que garantiza una mejora continua del rendimiento en la fase de inferencia de prueba y, en última instancia, logra excelentes resultados en múltiples conjuntos de datos y reduce significativamente el consumo de recursos.
Recientemente, el equipo de investigación de IA de Microsoft lanzó la herramienta de código abierto PromptWizard, un marco de IA basado en comentarios diseñado para optimizar de manera eficiente el diseño rápido de modelos de lenguaje grandes (LLM). La calidad de las sugerencias es fundamental para la calidad del resultado del modelo; sin embargo, crear sugerencias de alta calidad a menudo requiere mucho tiempo y recursos humanos, especialmente en tareas complejas o de dominios específicos.
Los métodos tradicionales de optimización rápida se basan principalmente en la experiencia manual, que no solo requiere mucho tiempo sino que también es difícil de expandir. Las técnicas de optimización existentes se dividen en dos tipos: continua y discreta. Las técnicas continuas, como las indicaciones suaves, requieren amplios recursos informáticos, mientras que los métodos discretos como PromptBreeder y EvoPrompt se evalúan generando múltiples variantes de indicaciones. Aunque estos métodos funcionan bien en algunos casos, carecen de un mecanismo de retroalimentación efectivo, lo que a menudo da como resultado resultados. insatisfactorio.
PromptWizard mejora significativamente el desempeño de las tareas al introducir un mecanismo de retroalimentación y utilizar un enfoque crítico e integral para optimizar repetidamente las instrucciones y ejemplos rápidos. Su flujo de trabajo se divide principalmente en dos etapas: la etapa de generación y la etapa de inferencia de prueba. En la fase de generación, el sistema aprovecha un modelo de lenguaje grande para generar múltiples variantes de las señales subyacentes y las evalúa para encontrar candidatos de alto rendimiento. Al mismo tiempo, el mecanismo de crítica incorporado del marco analizará las ventajas y desventajas de cada mensaje y proporcionará comentarios para guiar la optimización posterior. Después de múltiples rondas de optimización, el sistema puede mejorar la diversidad y calidad de las indicaciones.
Durante la fase de inferencia de la prueba, se aplican sugerencias y ejemplos optimizados a nuevas tareas para garantizar una mejora continua del rendimiento. Con este enfoque, PromptWizard lleva a cabo extensos experimentos en 45 tareas y logra excelentes resultados tanto en entornos supervisados como no supervisados. Por ejemplo, logra una precisión no supervisada del 90 % en el conjunto de datos GSM8K y del 82,3 % en SVAMP. Además, en comparación con métodos discretos como PromptBreeder, PromptWizard reduce las llamadas API y el uso de tokens hasta 60 veces, lo que demuestra su eficiencia en entornos con recursos limitados.
El éxito de PromptWizard radica en su innovadora optimización de secuencias, crítica guiada e integración de roles de expertos, lo que le permite adaptarse eficazmente a tareas específicas y tener una buena interpretabilidad. Este progreso presagia la importancia de los marcos de automatización en los flujos de trabajo de procesamiento del lenguaje natural y se espera que promueva aplicaciones más efectivas y económicas de tecnologías avanzadas de IA.
Blog: https://www.microsoft.com/en-us/research/blog/promptwizard-the-future-of-prompt-optimization-through-feedback-driven-self-evolving-prompts/
Código del proyecto: https://github.com/microsoft/PromptWizard?tab=readme-ov-file
Documento: https://www.microsoft.com/en-us/research/publication/promptwizard-task-aware-agent-driven-prompt-optimization-framework/
Destacar:
PromptWizard es un nuevo marco de IA que se utiliza para optimizar las indicaciones para modelos de lenguaje grandes y mejorar el rendimiento del modelo.
Este marco combina mecanismos de crítica y circuitos de retroalimentación para generar y evaluar de manera eficiente múltiples variantes de indicaciones.
PromptWizard muestra una precisión excelente en múltiples tareas y reduce significativamente el consumo y el costo de recursos.
En general, PromptWizard proporciona una herramienta poderosa para la optimización rápida de palabras de modelos de lenguaje grandes a través de mecanismos innovadores impulsados por retroalimentación y estrategias de optimización eficientes. Su eficiencia y precisión le brindan ventajas significativas en aplicaciones prácticas, proporcionando una herramienta poderosa para la IA Contribuir al desarrollo. de tecnología. Los lectores interesados pueden visitar los enlaces proporcionados para obtener más información.