Los investigadores de Microsoft han lanzado un nuevo marco de inteligencia artificial llamado Auto Evol-Instruct que puede desarrollar automáticamente conjuntos de datos de guía sin ninguna intervención humana. Esto es de gran importancia para mejorar la capacidad de los modelos de lenguaje grandes (LLM) para seguir instrucciones complejas. Los métodos evolutivos tradicionales se basan en reglas diseñadas artificialmente, que son ineficientes y difíciles de adaptar a nuevas tareas. Auto Evol-Instruct, por otro lado, analiza automáticamente instrucciones a través de LLM, diseña y optimiza de forma independiente las reglas de evolución, realiza un proceso de evolución automatizado y eficiente y mejora en gran medida la complejidad y diversidad de los conjuntos de datos.
Recientemente, los investigadores de Microsoft propusieron un nuevo marco de IA llamado Auto Evol-Instruct, que puede evolucionar automáticamente conjuntos de datos de guía sin ninguna intervención humana.
En el campo de la inteligencia artificial, el desarrollo de grandes modelos de lenguaje (LLM) es crucial, especialmente para mejorar la capacidad de estos modelos para seguir instrucciones detalladas. Los investigadores han estado explorando cómo mejorar los conjuntos de datos utilizados para capacitar a los LLM para mejorar el rendimiento y la adaptabilidad de los modelos.
Los métodos de evolución tradicionales, como Evol-Instruct, se basan en reglas de evolución especificadas por expertos humanos, lo que no sólo es costoso y requiere mucho tiempo, sino que también requiere un rediseño del método al adaptarse a nuevas tareas. Por el contrario, Auto Evol-Instruct realiza el proceso de evolución automatizado utilizando primero LLM para analizar las instrucciones de entrada y diseñar de forma independiente el método inicial de las reglas de evolución. Posteriormente, el método de evolución se optimiza iterativamente a través de LLM optimizadores para identificar y resolver problemas durante el proceso de evolución para garantizar la complejidad y estabilidad de las instrucciones de evolución finales.
Auto Evol-Instruct utiliza LLM para diseñar métodos de evolución analizando automáticamente instrucciones de entrada y formulando reglas de evolución, aumentando así la complejidad y diversidad de los conjuntos de datos.
En términos de evaluación del desempeño, Auto Evol-Instruct se desempeña bien en múltiples pruebas comparativas. Por ejemplo, al ajustar Mixtral-8x7B utilizando solo datos ShareGPT evolucionados de 10K, el marco logró 8,09 puntos en MT-Bench y 91,4 puntos en AlpacaEval, superando a GPT-3.5-Turbo y WizardLM-70B, y compitiendo con Claude2.0 es equivalente.
Además, al utilizar solo datos de entrenamiento de GSM8K evolucionado de 7K, el marco logra 82,49 puntos en GSM8K. En términos de generación de código, al ajustar DeepSeek-Coder-Base-33B utilizando Code Alpaca evolucionado de 20K, el marco logra una puntuación de 82,49 en. HumanEval logró una puntuación de 77,4, superando a otros modelos de la competencia.
Se puede ver que este nuevo marco tuvo un buen desempeño en múltiples pruebas de referencia, incluidas MT-Bench, AlpacaEval, GSM8K y HumanEval, lo que demuestra su potencial para mejorar el seguimiento de instrucciones, el razonamiento matemático y las capacidades de generación de código.
Dirección del artículo: https://arxiv.org/abs/2406.00770
Reflejos:
Auto Evol-Instruct es un marco de IA totalmente automático que puede analizar y evolucionar automáticamente conjuntos de datos de guía sin intervención humana.
El marco aumenta efectivamente la complejidad y diversidad de los conjuntos de datos al optimizar el método de evolución, mejorando así el rendimiento y la adaptabilidad de los LLM en diversas tareas.
Los resultados de Auto Evol-Instruct demuestran un método para guiar la evolución de conjuntos de datos a través de la automatización.
La aparición del marco Auto Evol-Instruct marca una innovación importante en el método de evolución de los datos de entrenamiento de los LLM. Sus características automatizadas y eficientes promoverán en gran medida el desarrollo de los LLM y brindarán un fuerte apoyo para la construcción de modelos de IA más potentes y adaptables. Se han publicado artículos relevantes y los lectores interesados pueden estudiarlos en profundidad.