Редактор Downcodes сообщил: OpenAI выпустила революционную технологию генерации изображений AI sCM, которая добилась прорывного прогресса в скорости и эффективности генерации изображений и может быть названа важной вехой в области изображений AI. Упрощая этапы расчета, модель sCM достигает волшебного эффекта создания высококачественных изображений всего за два шага и работает в 50 раз быстрее, чем традиционная диффузионная модель. Генерация изображения на графическом процессоре A100 занимает всего 0,11 секунды, а максимальные параметры модели достигают 1,5 миллиарда, устанавливая новый рекорд отрасли. Эта технология не только показала отличные результаты испытаний на наборах данных CIFAR-10 и ImageNet, но также показала большой потенциал расширения, заложив прочную основу для обучения крупномасштабных моделей в будущем.
Основные технические преимущества:
Создавайте высококачественные изображения всего за два этапа расчета
Создание изображения на графическом процессоре A100 занимает всего 0,11 секунды.
По сравнению с традиционной диффузионной моделью скорость увеличена в 50 раз.
Максимальные параметры модели достигли 1,5 миллиардов, установив новый рекорд
В реальных тестах sCM показал впечатляющие результаты. Он получил оценку FID 2,06 в наборе данных CIFAR-10 и отличную оценку 1,88 при создании изображений размером 512x512 пикселей в ImageNet. Эти показатели лишь примерно на 10% отстают от лучших существующих моделей диффузии, но представляют собой качественный скачок в скорости.
Ключом к технологическим инновациям является решение фундаментальных проблем традиционной модели согласованности. Предыдущие модели использовали дискретные шаги по времени, что не только требовало дополнительных параметров, но и было подвержено ошибкам. Исследовательская группа OpenAI объединила различные методы, создав упрощенную теоретическую основу, а также успешно определила и устранила основные причины нестабильности обучения.
Что еще более интересно, так это то, что эта технология демонстрирует большой потенциал расширения. OpenAI успешно обучила модель с 1,5 миллиардами параметров на наборе данных ImageNet, что является первым случаем для подобной модели. Исследование показало, что по мере увеличения размера модели качество изображения продолжает улучшаться, а это означает, что в будущем может стать возможным более крупномасштабное обучение модели.
Появление технологии sCM знаменует собой новую волну развития в области создания изображений ИИ. Ее огромное улучшение скорости и эффективности откроет возможности для большего количества сценариев применения. Давайте подождем и посмотрим, что принесет OpenAI в будущем. прорыв!