Исследователи из Вашингтонского университета предлагают инновационный метод настройки агентов, который эффективно оптимизирует большие языковые модели, не требуя доступа к весам моделей. Этот метод направляет прогнозы базовой модели в сторону настроенной модели путем сравнения прогнозов небольшой настроенной модели и ненастроенной модели, тем самым улучшая производительность модели и лучше сохраняя знания об обучении. Эта революционная технология была проверена в экспериментах по точной настройке оригинальных моделей LLAMA-2 13B и 70B, продемонстрировав ее значительные преимущества в эффективности.
Веб-мастер Хоум сообщил, что Вашингтонский университет запустил метод прокси-настройки, который позволяет добиться эффективной настройки больших моделей без изменения весов моделей путем сравнения результатов прогнозирования небольших скорректированных моделей и нескорректированных моделей. Этот метод позволяет лучше сохранить обучающие знания во время декодирования и повысить эффективность настройки. Эффективность настройки агента была проверена исследователями, настраивавшими оригинальные модели LIAMA-2 13B и 70B. Этот метод представляет собой инновационный метод настройки путем сравнения распределений выходных прогнозов базовой модели M и модели настройки M+, чтобы направлять прогнозы базовой модели в направлении модели настройки. Метод настройки агента обеспечивает решение для эффективной настройки больших моделей при лучшем сохранении обучающих знаний во время декодирования, что, как ожидается, принесет новые знания в область искусственного интеллекта.Этот новый метод обеспечивает более удобный и эффективный способ настройки больших моделей, уменьшает необходимость прямого манипулирования весами модели и эффективно повышает производительность модели и возможности сохранения знаний, открывая новые возможности для развития области искусственного интеллекта. Ожидается, что в будущем этот метод будет применяться для более масштабной настройки языковых моделей, что будет способствовать дальнейшему развитию технологий искусственного интеллекта.