В этой статье представлено революционное исследование, проведенное исследователями ByteDance и POSTECH, которое значительно повышает вычислительную эффективность модели преобразования текста в изображение (T2I) FLUX.1-dev за счет 1,58-битной технологии квантования, что позволяет ей работать в условиях ограничений ресурсов, работающих на устройство. Этот метод требует только самостоятельного обучения самой модели и не требует доступа к данным изображения. Он может сжать пространство для хранения модели в 7,7 раза и сократить использование памяти вывода более чем в 5,1 раза, сохраняя при этом то же качество генерации, что и метод. модель полной точности. Это исследование открывает новые возможности для развертывания высокопроизводительных моделей T2I на мобильных устройствах и других платформах, а также дает ценный опыт для будущих исследований по оптимизации моделей ИИ.
Быстрое развитие моделей преобразования текста в изображения на основе искусственного интеллекта принесло новые возможности и проблемы во все сферы жизни. Результаты исследований ByteDance и POSTECH обеспечивают эффективное решение проблемы развертывания высокопроизводительных моделей ИИ на устройствах с ограниченными ресурсами. Их значительные улучшения в сжатии моделей, оптимизации памяти и поддержании производительности откроют путь для будущих приложений ИИ. Популяризация и развитие заложили прочную основу. Будущие исследования будут направлены на дальнейшее изучение того, как преодолеть ограничения 1,58-битного FLUX по скорости и детализационному рендерингу изображений с высоким разрешением, чтобы обеспечить более широкие возможности применения.