Редактор Downcodes узнал, что Stability AI в очередной раз продемонстрировал свой прорывной прогресс в сфере ИИ и выпустил новую модель Stable Diffusion 3.5 Medium! Этот бесплатный коммерческий, высокопроизводительный и простой в использовании инструмент для рисования с использованием искусственного интеллекта полностью изменит общественный опыт создания искусственного интеллекта. Он устраняет зависимость предыдущих инструментов рисования с использованием искусственного интеллекта от высокопроизводительного оборудования, позволяя большему количеству людей легко ощутить очарование рисования с использованием искусственного интеллекта.
Stability AI снова преодолевает технические барьеры и запускает новую модель Stable Diffusion3.5Medium. Этот общедоступный инструмент рисования с использованием искусственного интеллекта не только полностью бесплатен и открыт для коммерческого использования, но, что более важно, он обеспечивает идеальный баланс высокой производительности и популярности.
Эта модель использует архитектуру многорежимного диффузионного трансформатора (MMDiT-X) и имеет упрощенную конструкцию с 2,5 миллиардами параметров, умело решая проблему аппаратного порога для обычных пользователей. Для него требуется всего 9,9 ГБ видеопамяти, и он может бесперебойно работать на большинстве видеокарт потребительского уровня, действительно реализуя концепцию доступности для каждого.
С точки зрения технологических инноваций, модель объединяет три предварительно обученных кодировщика текста и представляет технологию стандартизации QK для повышения стабильности обучения. Особо стоит отметить, что конструкция модуля двойного внимания в первых 12 слоях преобразования позволяет модели значительно улучшить качество изображения, эффекты макета и понимание сложных подсказок.
Процесс обучения модели объединяет синтетические данные и выбранные общедоступные данные и использует гибридную стратегию обучения с прогрессивным улучшением разрешения для обеспечения разнообразия и качества генерируемых изображений. По сравнению с аналогичными моделями среднего размера он показывает очевидные преимущества в эффектах генерации изображения и скорости обработки.
Однако пользователям необходимо обратить внимание на некоторые детали во время использования: слишком длинные слова-подсказки могут вызвать дефекты по краям изображения. Рекомендуется использовать метод выборки с пропуском слоев, чтобы одновременно оптимизировать структурную целостность изображения; Следует отметить, что из-за различий в распределении обучающих данных одни и те же слова-подсказки могут давать разные творческие эффекты.
Выпуск этой модели не только предоставляет отдельным создателям и стартапам удобные инструменты для создания ИИ, но также отражает решимость Stability AI способствовать популяризации технологии ИИ. Независимо от того, используется ли он для художественного творчества или развития образования, он предоставит возможность создания ИИ более широкой группе пользователей.
Адрес загрузки модели: https://huggingface.co/stabilityai/stable-diffusion-3.5-medium.
В целом, появление Stable Diffusion 3.5 Medium снижает порог для рисования с помощью ИИ и предоставляет большему количеству людей возможность получать опыт и творить. Редактор Downcodes рекомендует попробовать и ощутить всю прелесть рисования ИИ!