Последняя модель искусственного интеллекта Meta, «Представь себя», подрывает традиционную модель создания изображений искусственного интеллекта. Он может создавать персонализированные изображения в различных стилях, позах и условиях с помощью всего одной фотографии без необходимости использования дополнительных обучающих данных. Редактор Downcodes даст вам более глубокое понимание технических инноваций, лежащих в основе этой удивительной модели искусственного интеллекта.
Meta недавно выпустила инновационную модель искусственного интеллекта под названием «Представь себя», которая может генерировать различные персонализированные изображения, используя только эталонную фотографию, без дополнительного обучения. Этот технологический прорыв создает иллюзию переноса в волшебный мир, показывая одного и того же человека в разных позах, стилях и обстановке.
В отличие от традиционных моделей искусственного интеллекта, Imagine Yourself использует новый способ работы. Он может одновременно обрабатывать фотографии и текстовые команды, гибко реагировать на новые требования и символы, а также значительно повышать эффективность и адаптируемость. Чтобы добиться этого прорыва, Meta внедрила две ключевые инновации в технологии:
Используйте синтетические данные обучения. Создавая синтетические варианты, соответствующие реальным фотографиям, модель учится представлять людей более ярко и разнообразно, а не просто копировать эталонные изображения.
Новый дизайн архитектуры: оснащен тремя параллельными модулями обработки текста и обучаемым модулем обработки изображений, что обеспечивает лучшую координацию изображений и текста.
По словам Меты, Imagine самостоятельно хорошо справляется со сложными инструкциями, такими как изменение выражений лица, позы головы и даже размещение персонажей в новой среде. Хотя сохранение идентичности иногда не соответствует другим моделям, это главным образом потому, что конкуренты часто просто копируют эталонные изображения, в результате чего результаты выглядят менее естественно.
Стоит отметить, что эту модель также можно расширить для создания изображений нескольких человек путем параллельной обработки нескольких эталонных изображений, чтобы легко создавать фотографии группы людей в новых позах и условиях.
Хотя Imagine Yourself уже продемонстрировал потрясающие возможности, Meta продолжает совершенствоваться. В будущем они планируют расширить эту технологию до создания видео и даже обработки сложных жестов, таких как прыжки. Хотя модель и код еще не обнародованы, можно предвидеть, что эта технология приведет к новой тенденции в создании персонализированных изображений и принесет революционные изменения в творческую индустрию.
По мере развития технологий искусственного интеллекта мы ожидаем появления новых удивительных приложений, которые будут способствовать созданию визуальных эффектов и созданию персонализированного контента. Этот прорыв Meta, несомненно, указывает на новое направление для будущей технологии обработки изображений AI.
Появление Imagine Yourself открывает новую главу в области создания персонализированных изображений. В будущем мы можем рассчитывать на появление большего количества подобных моделей искусственного интеллекта, которые предоставят нам более удобный и креативный опыт создания изображений. Редактор Downcodes считает, что технологии искусственного интеллекта и дальше будут способствовать прогрессу и развитию креативной индустрии.