Недавно Google объявил, что ее последняя модель генерации изображений, ImageN3, теперь открыта для разработчиков через API Gemini. Эта модель не только обладает мощными возможностями генерации изображений, но и создает изображения в различных художественных стилях, основанных на входных текстовых сигналах, охватывающих широкий спектр областей, от сюрреализма до аниме -персонажей.
Imagen3 очень прост в использовании. Стоимость генерации на изображение составляет всего 0,03 долл. США, подходящая для разработчиков и предприятий, которым требуется генерация партийных изображений. Благодаря этой разумной стратегии ценообразования Google стремится снизить порог для творческой работы и позволить большему количеству людей наслаждаться удовольствием художественного творения, принесенного ИИ.
Imagen3 демонстрирует выдающиеся способности при создании изображений. Будь то тонкие цвета или сложные детали, модель может точно реализовать идеи пользователя. Чтобы улучшить пользовательский опыт, Imagen3 также представил улучшенную функцию отслеживания подсказки. Например, описывая внешний вид и фон животного, модель может генерировать чрезвычайно подходящие изображения для удовлетворения творческих потребностей пользователей.
Кроме того, Imagen3 также учитывает авторские права и неправильное использование генерации изображений. Каждое сгенерированное изображение будет поставляться с невидимым цифровым водяным знаком под названием Synthid. Этот водяной знак не может быть распознан невооруженным глазом, но может быть проверен с помощью специализированной технологии, чтобы гарантировать, что изображения генерируются ИИ, эффективно ограничивая риски ложной информации и ненадлежащего использования.
Разработчикам также очень легко начать использовать Imagen3. С помощью простого примера кода Python пользователи могут быстро взаимодействовать с API и генерировать свои любимые изображения. Поскольку Google планирует подключить более генеративные модели к API Gemini в будущем, разработчики смогут создавать более интерактивный контент для стимулирования диверсификации креативных продуктов.
Google активно изучает комбинацию моделей генеративных носителей и языка, и сценарии приложений в будущем будут более обширными, и разработчики могут использовать эти технологии для реализации большего потенциала в создании контента и разработке инструментов.
Документация: https://ai.google.dev/gemini-api/docs/imagen-prompt-guide?hl=zh-cn
Движение Google еще больше способствует применению и разработке технологий искусственного интеллекта, чтобы все больше разработчиков и предприятий могли пользоваться удобством и инновациями, принесенными ИИ.