Stability AI объявляет о запуске стабильной диффузии 3.5 Medium, нового бесплатного коммерческого инструмента по рисованию искусственного интеллекта, вновь возглавляющего инновации технологии живописи искусственного интеллекта. С его высокой производительности и низким порогом эта модель привносит расширенные возможности живописи ИИ для общественности, действительно осознавая видение «Каждый может использовать». Он принимает оптимизированный дизайн параметров 2,5 миллиарда, который требует только 9,9 ГБ видео памяти для гладкого запуска, прорыв аппаратные ограничения обычных пользователей и значительно снижая порог для живописи искусственного интеллекта.
Стабильность AI еще раз прорывается через технические барьеры и запускает новую модель стабильной диффузии3.5medium. Этот инструмент для живописи ИИ для публики не только полностью свободен и открыт для коммерческого использования, но, что более важно, он достигает идеального баланса между высокой производительностью и популяризацией.
Эта модель, которая принимает архитектуру мультимодального диффузионного преобразователя (MMDIT-X), имеет оптимизированный дизайн 2,5 миллиарда параметров, умно решает задачу аппаратного порога обычных пользователей. Имея всего 9,9 ГБ видео памяти, она может гладко работать на большинстве видеокарт потребительского уровня, по-настоящему осознавая видение «Каждый может быть использован».
С точки зрения технологических инноваций, модель интегрирует три предварительно обученных текстовых кодеров и вводит технологию стандартизации QK для повышения стабильности обучения. Особенно стоит упомянуть, что конструкция модуля двойного внимания в его первых 12 слоях преобразования значительно улучшила модель с точки зрения качества изображения, эффекта макета и сложного быстрого понимания.
Процесс обучения модели объединяет синтетические данные с выбранными публичными данными и принимает гибридную стратегию обучения с прогрессивным улучшением разрешения, обеспечивая разнообразие и качество полученных изображений. По сравнению с аналогичными моделями среднего размера, он показывает очевидные преимущества в эффекте генерации изображений и скорости обработки.
Тем не менее, пользователи должны обращать внимание на некоторые детали во время использования: чрезмерные слова могут вызвать дефекты на краю изображения; В то же время следует отметить, что из -за различий в распределении учебных данных одни и те же быстрые слова могут создавать различные творческие эффекты.
Выпуск этой модели не только предоставляет удобные инструменты создания ИИ для отдельных создателей и стартапов, но также отражает определение AI стабильности для содействия популяризации технологии ИИ. Независимо от того, используется ли для художественного создания или разработки образования, это даст возможность созданию ИИ для более широкой базы пользователей.
Адрес загрузки модели: https://huggingface.co/stability/stable-diffusion-3.5-medium
Появление стабильной диффузии 3.5 среднего знаменует собой стадию технологии живописи искусственного искусства, становясь более популярной и простым в использовании. Его бесплатный коммерческий характер и низкие требования к оборудованию откроют дверь для художественного создания ИИ для большего количества людей и способствуют применению и разработке технологии ИИ в различных областях.