Стабильность AI объявляет о запуске стабильной диффузии 3.5, серии из трех различных версий крупных моделей генерации текста до изображения. Серия направлена на удовлетворение широкого спектра потребностей от исследователей до предприятия клиентов для энтузиастов, предоставляя модели различных шкал параметров и характеристик производительности в соответствии с различными вычислительными возможностями и сценариями приложений. Обновление предназначено для реагирования на предыдущие недостатки стабильной диффузии 3.0 и конкурировать с другими ведущими инструментами генерации изображений ИИ на рынке.
Стабильность AI недавно запустила свою последнюю модель глубокого обучения генерации текста до изображения-стабильная диффузия3.5. Этот релиз включает в себя три улучшенные модели с открытым исходным кодом, предназначенные для удовлетворения потребностей различных пользователей, включая исследователей, корпоративных клиентов и энтузиастов.
Среди них стабильная диффузия3.5large является самой мощной моделью во всей серии, с параметрами до 8,1 миллиарда. Благодаря отличному качеству изображения и высокой отзывчивостью к подсказкам, модель идеально подходит для профессиональных пользователей, способных генерировать высококачественные изображения с разрешением до 1 мегапикселя.
Кроме того, стабильная диффузия3.5large Turbo является упрощенной версией стабильной диффузии3.5large. При создании высококачественных изображений он значительно улучшает скорость.
Другая новая модель - стабильная диффузия3.5Medium, которая имеет 2,5 миллиарда параметров. Модель принимает улучшенный метод архитектуры и обучения MMDIT-X, предназначенный для того, чтобы быть «вне коробки» и работает гладко даже на потребительском оборудовании. Он достигает хорошего баланса между качеством генерации изображений и легкостью настройки, создавая от 0,25 до 2 мегапиксельных изображений.
Фон этого релиза заключается в том, что после июньского выпуска стабильной диффузии3Medium не соответствовал ожиданиям, стабильность AI решила запустить более преобразующее решение. Компания заявила, что они надеются восстановить конкурентоспособность на рынке с обновлением, чтобы удовлетворить проблемы с таких платформ, как Dall-E и Midjourney.
Важным технологическим инновациями в новой модели является введение технологии нормализации ключей. Это инновация усиливает настройку модели и отзывчивость на подсказки, и пользователи могут получить более последовательные результаты с четкими подсказками, а также получают более богатую интерпретацию изображения при использовании более широких подсказок.
Модель серии Custable Diffusion3.5 будет выпущена по лицензии сообщества AI Stability, что позволит пользователям использовать некоммерчески бесплатно. В то же время организации с годовым доходом, менее 1 миллиона долларов США, также могут использоваться для коммерческого использования бесплатно, в то время как пользователи с избыточным доходом должны подать заявку на корпоративную лицензию.
Все модели и их самостоятельные веса предоставляются на API-интерфейсах обнимающегося лица и стабильности. Кроме того, ожидается, что функция ControlNets, которая предлагает расширенные параметры настройки изображений, будет запущена в ближайшие дни.
Официальный вход:
https://stability.ai/stable-image
Три версии обнимающих порталов лица:
https://huggingface.co/stability/stable-diffusion-3.5-large
https://huggingface.co/stability/stable-diffusion-3.5-large-turbo
https://huggingface.co/stability/stable-diffusion-3.5-medium
Ключевые моменты:
Недавно запущенная стабильная диффузия3.5 предлагает три модели версии для удовлетворения различных потребностей пользователей.
Стабильная диффузия.
Новая модель вводит технологию нормализации ключей, которая улучшает настройку и отзывчивость.
Короче говоря, запуск модели серии стабильной диффузии 3.5 знаменует собой основное обновление AI стабильности в области генерации текста до изображения. В жесткой конкуренции рынка. Посетите предоставленные ссылки и испытайте новую технологию генерации изображений!