Os pesquisadores da Microsoft lançaram uma nova estrutura de IA chamada Auto Evol-Instruct que pode evoluir automaticamente conjuntos de dados de orientação sem qualquer intervenção humana. Isto é de grande importância para melhorar a capacidade dos grandes modelos de linguagem (LLMs) de seguir instruções complexas. Os métodos evolutivos tradicionais baseiam-se em regras concebidas artificialmente, que são ineficientes e difíceis de adaptar a novas tarefas. O Auto Evol-Instruct, por outro lado, analisa instruções automaticamente por meio de LLMs, projeta e otimiza regras de evolução de forma independente, realiza um processo de evolução automatizado e eficiente e melhora muito a complexidade e diversidade dos conjuntos de dados.
Recentemente, os pesquisadores da Microsoft propuseram uma nova estrutura de IA chamada Auto Evol-Instruct, que pode evoluir automaticamente conjuntos de dados de orientação sem qualquer intervenção humana.
No campo da inteligência artificial, o desenvolvimento de grandes modelos de linguagem (LLMs) é crucial, especialmente para melhorar a capacidade destes modelos de seguir instruções detalhadas. Os pesquisadores têm explorado como melhorar os conjuntos de dados usados para treinar LLMs para melhorar o desempenho e a adaptabilidade dos modelos.
Os métodos tradicionais de evolução, como o Evol-Instruct, baseiam-se em regras de evolução especificadas por especialistas humanos, o que não só é caro e demorado, mas também requer um redesenho do método ao adaptá-lo a novas tarefas. Em contraste, o Auto Evol-Instruct realiza o processo de evolução automatizado usando primeiro LLMs para analisar instruções de entrada e projetar de forma independente o método inicial de regras de evolução. Posteriormente, o método de evolução é otimizado iterativamente através de LLMs otimizadores para identificar e resolver problemas durante o processo de evolução para garantir a complexidade e estabilidade das instruções finais de evolução.
O Auto Evol-Instruct utiliza LLMs para projetar métodos de evolução analisando automaticamente instruções de entrada e formulando regras de evolução, aumentando assim a complexidade e a diversidade dos conjuntos de dados.
Em termos de avaliação de desempenho, o Auto Evol-Instruct tem um bom desempenho em vários testes de benchmark. Por exemplo, ao ajustar o Mixtral-8x7B usando apenas 10K de dados ShareGPT evoluídos, a estrutura alcançou 8,09 pontos no MT-Bench e 91,4 pontos no AlpacaEval, ultrapassando GPT-3.5-Turbo e WizardLM-70B, e competindo com Claude2.0 é equivalente.
Além disso, ao usar apenas dados de treinamento GSM8K evoluídos de 7K, a estrutura atinge 82,49 pontos em GSM8K. Em termos de geração de código, ao ajustar o DeepSeek-Coder-Base-33B usando Code Alpaca evoluído de 20K, a estrutura atinge uma pontuação de 82,49 em. HumanEval alcançou pontuação de 77,4, superando outros modelos concorrentes.
Pode-se observar que esta nova estrutura teve um bom desempenho em vários testes de benchmark, incluindo MT-Bench, AlpacaEval, GSM8K e HumanEval, demonstrando seu potencial na melhoria do seguimento de instruções, raciocínio matemático e capacidades de geração de código.
Endereço do artigo: https://arxiv.org/abs/2406.00770
Destaques:
Auto Evol-Instruct é uma estrutura de IA totalmente automática que pode analisar e desenvolver automaticamente conjuntos de dados de orientação sem intervenção humana.
A estrutura aumenta efetivamente a complexidade e a diversidade dos conjuntos de dados, otimizando o método de evolução, melhorando assim o desempenho e a adaptabilidade dos LLMs em diversas tarefas.
Os resultados do Auto Evol-Instruct demonstram um método para orientar a evolução de conjuntos de dados através da automação.
O surgimento da estrutura Auto Evol-Instruct marca uma grande inovação no método de evolução dos dados de treinamento de LLMs. Seus recursos automatizados e eficientes promoverão enormemente o desenvolvimento de LLMs e fornecerão forte suporte para a construção de modelos de IA mais poderosos e adaptáveis. Artigos relevantes foram publicados e os leitores interessados podem estudá-los em profundidade.