Недавно Microsoft выпустила новый метод сжатия больших языковых моделей под названием SliceGPT. Эта технология позволяет значительно уменьшить размер параметров больших языковых моделей, сохраняя при этом их производительность. Умно заменяя матрицу весов, SliceGPT достигает степени сжатия параметров до 25 %, не влияя при этом на эффективность вычислений. Этот шаг имеет большое значение для развертывания больших языковых моделей на устройствах с ограниченными ресурсами и знаменует собой крупный прорыв в повышении эффективности технологий искусственного интеллекта. Это значительно расширит область применения больших языковых моделей и обеспечит удобство для большего числа разработчиков и пользователей.
Microsoft запускает SliceGPT, новый метод сжатия больших языковых моделей. Заменяя весовую матрицу и сохраняя вычислительную инвариантность, SLICE GPT может уменьшить параметры большой языковой модели до 25 %, сохранив при этом производительность. Этот метод подходит для различных моделей преобразовательных сетей и имеет широкие перспективы применения в устройствах с ограниченными ресурсами.
Появление SliceGPT обеспечивает эффективный способ решения проблемы крупномасштабного развертывания языковых моделей. В будущем мы можем рассчитывать на появление большего количества подобных технологий для дальнейшего содействия популяризации и развитию технологий искусственного интеллекта, что позволит технологиям ИИ принести пользу более широкому кругу областей и людей. Это придаст новую жизнь области искусственного интеллекта, и стоит с нетерпением ждать последующих приложений и разработок.