Исследователи Microsoft выпустили новую платформу искусственного интеллекта под названием Auto Evol-Instruct, которая может автоматически изменять наборы данных навигации без какого-либо вмешательства человека. Это имеет большое значение для улучшения способности больших языковых моделей (LLM) следовать сложным инструкциям. Традиционные эволюционные методы опираются на искусственно созданные правила, которые неэффективны и их трудно адаптировать к новым задачам. Auto Evol-Instruct, с другой стороны, автоматически анализирует инструкции через LLM, самостоятельно разрабатывает и оптимизирует правила эволюции, реализует автоматизированный и эффективный процесс эволюции и значительно повышает сложность и разнообразие наборов данных.
Недавно исследователи Microsoft предложили новую систему искусственного интеллекта под названием Auto Evol-Instruct, которая может автоматически изменять наборы данных навигации без какого-либо вмешательства человека.
В области искусственного интеллекта разработка больших языковых моделей (LLM) имеет решающее значение, особенно для улучшения способности этих моделей следовать подробным инструкциям. Исследователи изучают, как улучшить наборы данных, используемые для обучения LLM, чтобы повысить производительность и адаптируемость моделей.
Традиционные методы эволюции, такие как Evol-Instruct, основаны на правилах эволюции, заданных экспертами-людьми, что не только дорого и отнимает много времени, но также требует перепроектирования метода при адаптации к новым задачам. Напротив, Auto Evol-Instruct реализует автоматизированный процесс эволюции, сначала используя LLM для анализа входных инструкций и независимой разработки исходного метода правил эволюции. Впоследствии метод эволюции итеративно оптимизируется с помощью оптимизатора LLM для выявления и решения проблем в процессе эволюции, чтобы обеспечить сложность и стабильность окончательных инструкций эволюции.
Auto Evol-Instruct использует LLM для разработки методов эволюции путем автоматического анализа входных инструкций и формулирования правил эволюции, тем самым увеличивая сложность и разнообразие наборов данных.
Что касается оценки производительности, Auto Evol-Instruct показывает хорошие результаты в нескольких тестах производительности. Например, за счет точной настройки Mixtral-8x7B с использованием только 10 тыс. развитых данных ShareGPT платформа набрала 8,09 балла в MT-Bench и 91,4 балла в AlpacaEval, превзойдя GPT-3.5-Turbo и WizardLM-70B и конкурируя с Claude2.0. эквивалент.
Кроме того, используя только 7K расширенных обучающих данных GSM8K, платформа набирает 82,49 балла на GSM8K. Что касается генерации кода, за счет тонкой настройки DeepSeek-Coder-Base-33B с использованием 20K развитого кода Alpaca платформа достигает оценки 82,49 на. HumanEval набрал 77,4 балла, превзойдя другие конкурирующие модели.
Видно, что эта новая платформа хорошо показала себя в нескольких тестах производительности, включая MT-Bench, AlpacaEval, GSM8K и HumanEval, продемонстрировав свой потенциал в улучшении выполнения инструкций, математических рассуждений и возможностей генерации кода.
Адрес статьи: https://arxiv.org/abs/2406.00770.
Основные моменты:
Auto Evol-Instruct — это полностью автоматическая платформа искусственного интеллекта, которая может автоматически анализировать и развивать наборы данных навигации без вмешательства человека.
Эта структура эффективно увеличивает сложность и разнообразие наборов данных за счет оптимизации метода эволюции, тем самым повышая производительность и адаптируемость LLM к различным задачам.
Результаты Auto Evol-Instruct демонстрируют метод управления развитием наборов данных посредством автоматизации.
Появление платформы Auto Evol-Instruct знаменует собой крупную инновацию в методе эволюции данных обучения LLM. Ее автоматизированные и эффективные функции будут значительно способствовать развитию LLM и обеспечат надежную поддержку для создания более мощных и адаптируемых моделей искусственного интеллекта. Соответствующие статьи опубликованы, и заинтересованные читатели могут их подробно изучить.