Google Labs недавно запустила Whisk, инструмент для создания искусственных изображений на основе изображений, который привносит новый опыт в создание произведений искусства. В отличие от традиционных инструментов создания изображений с текстовыми подсказками, Whisk позволяет пользователям напрямую загружать или создавать изображения с помощью инструмента и указывать темы, сцены и стили для достижения более интуитивно понятного художественного творчества. Пользователи могут смешивать и сочетать различные компоненты и выполнять тонкую настройку с помощью текстовых подсказок для создания уникальных и творческих произведений искусства. Технология, лежащая в основе Whisk, представляет собой комбинацию мощной языковой модели Google и модели генерации изображений, которая может улавливать основные характеристики изображения, а не просто копировать его.
Google Labs недавно запустила в США Whisk, свой новейший инструмент для экспериментов с генеративным искусственным интеллектом. В отличие от традиционных инструментов создания изображений, которые полагаются в основном на текстовые подсказки, Whisk фокусируется на использовании изображений в качестве метода ввода, что позволяет пользователям более интуитивно создавать произведения искусства.
Пользователи могут загружать изображения непосредственно в Whisk или создавать изображения с помощью инструмента, указывая такие элементы, как тема, сцена и стиль. Система Whisk позволяет пользователям смешивать и сочетать эти компоненты и производить точную настройку по мере необходимости, используя дополнительные текстовые подсказки.
Стоит отметить, что языковая модель Google (вероятно, недавно выпущенная Gemini 2.0 Flash) автоматически генерирует подробное описание входного изображения. Эти описания будут введены в новейшую модель генерации изображений Google Imagen3, которая фиксирует основные характеристики объекта, а не создает точную копию.
AIbase провела множество тестов. После загрузки трех изображений слева их можно объединить, чтобы получить результат справа. Эффект довольно хороший, а играбельность очень высокая. следующее:
Однако, поскольку Whisk извлекает только несколько ключевых элементов из каждого исходного изображения, Google предупреждает пользователей, что полученные результаты изображения могут отличаться от ожиданий. Например, полученное изображение может отличаться от исходного изображения ростом, весом, прической или цветом кожи.
Google утверждает, что эти детали часто имеют решающее значение для успеха проекта, поэтому он позволяет пользователям просматривать и редактировать текстовые подсказки, которые управляют процессом создания изображений.
Первые тестеры, в том числе некоторые художники и творческие профессионалы, говорят, что Whisk больше похож на новый творческий инструмент, чем на традиционный редактор изображений. Google надеется, что этот инструмент поможет пользователям быстро проводить визуальный мозговой штурм, а не точное редактирование, позволяя пользователям быстро генерировать и фильтровать несколько вариантов перед сохранением любимых работ.
После предварительного тестирования, хотя Whisk очень приятен в использовании, для создания каждого нового изображения требуется несколько секунд ожидания. Эти задержки, вероятно, связаны с большим трафиком, поскольку пользователи стекаются, чтобы опробовать новый инструмент.
В настоящее время Whisk доступен только пользователям в США. Пользователи могут попробовать его бесплатно и поделиться отзывами на странице labs.google/whisk. Что касается пользователей в других странах, то они временно не могут получить доступ к этому инструменту.
Whisk является частью Google Labs, которая является испытательным полигоном Google для тестирования своих проектов искусственного интеллекта, включая Gemini, Imagen и новейшую видеомодель Veo2. Хотя большинство проектов все еще находятся на экспериментальной стадии, некоторые успешные проекты, такие как недавно официально выпущенный AI-помощник NotebookLM, будут преобразованы в полноценные продукты.
Адрес для ознакомления с продуктом: https://top.aibase.com/tool/whisk.
Выделять:
Google запускает Whisk, первый инструмент генеративного искусственного интеллекта на основе изображений.
Пользователи могут загружать или создавать изображения для быстрого визуального проектирования, а не для точного редактирования.
Пробная версия в настоящее время доступна только пользователям в США и временно недоступна для других стран.
В целом, Whisk, новый инструмент для создания изображений с использованием искусственного интеллекта, запущенный Google Labs, предоставляет пользователям более интуитивно понятный и быстрый способ создания произведений искусства. Хотя он все еще находится на стадии тестирования, его потенциал огромен, и его будущее развитие стоит того. с нетерпением жду. Мы с нетерпением ожидаем расширения Whisk для пользователей по всему миру в будущем и дальнейшей оптимизации его функциональности и производительности.