Google Labs lanzó recientemente Whisk, una herramienta de generación de arte con inteligencia artificial basada en imágenes, que brinda una nueva experiencia a la creación de arte. A diferencia de las herramientas tradicionales de generación de imágenes con mensajes de texto, Whisk permite a los usuarios cargar o generar imágenes directamente dentro de la herramienta y especificar temas, escenas y estilos para lograr una creación artística más intuitiva. Los usuarios pueden mezclar y combinar diferentes componentes y ajustarlos con indicaciones de texto para producir obras de arte únicas y creativas. La tecnología detrás de Whisk es una combinación del poderoso modelo de lenguaje y modelo de generación de imágenes de Google, que puede capturar las características esenciales de la imagen en lugar de simplemente copiarla.
Google Labs lanzó recientemente Whisk, su última herramienta experimental de inteligencia artificial generativa, en Estados Unidos. A diferencia de las herramientas tradicionales de generación de imágenes que se basan principalmente en indicaciones de texto, Whisk se centra en el uso de imágenes como método de entrada, lo que permite a los usuarios crear obras de arte de forma más intuitiva.
Los usuarios pueden cargar imágenes directamente en Whisk o generar imágenes dentro de la herramienta, especificando elementos como tema, escena y estilo. El sistema Whisk permite a los usuarios mezclar y combinar estos componentes y ajustarlos según sea necesario mediante indicaciones de texto adicionales.
Vale la pena señalar que, detrás de escena, el modelo de lenguaje de Google (probablemente el recientemente lanzado Gemini 2.0 Flash) genera automáticamente una descripción detallada de la imagen de entrada. Estas descripciones se introducirán en el último modelo de generación de imágenes de Google, Imagen3, que captura las características esenciales del sujeto en lugar de crear una réplica exacta.
AIbase ha realizado muchas pruebas. Después de cargar las tres imágenes de la izquierda, se pueden fusionar para generar el resultado de la derecha. El efecto es bastante bueno y la jugabilidad es muy alta. como sigue:
Sin embargo, dado que Whisk solo extrae algunos elementos clave de cada imagen fuente, Google advierte a los usuarios que los resultados de la imagen resultante pueden diferir de las expectativas. Por ejemplo, la imagen resultante puede diferir de la imagen original en altura, peso, peinado o color de piel.
Google dice que estos detalles suelen ser críticos para el éxito de un proyecto, por lo que permite a los usuarios ver y editar las indicaciones de texto que impulsan el proceso de generación de imágenes.
Los primeros evaluadores, incluidos algunos artistas y profesionales creativos, dicen que Whisk se siente más como una nueva herramienta creativa que como un editor de imágenes tradicional. Google espera que la herramienta ayude a los usuarios a realizar rápidamente una lluvia de ideas visual en lugar de una edición precisa, permitiéndoles generar y filtrar rápidamente múltiples opciones antes de guardar sus obras favoritas.
Después de las pruebas preliminares, aunque Whisk es muy agradable de usar, requiere unos segundos de espera para que se genere cada nueva imagen. Es probable que estos retrasos se deban al alto tráfico, ya que los usuarios acuden en masa para probar la nueva herramienta.
Actualmente, Whisk solo está disponible para usuarios de Estados Unidos y los usuarios pueden probarlo de forma gratuita y compartir comentarios en labs.google/whisk. En cuanto a los usuarios de otros países, temporalmente no pueden acceder a esta herramienta.
Whisk es parte de Google Labs, que es el campo de pruebas de Google para probar sus proyectos de inteligencia artificial, incluidos Gemini, Imagen y el último modelo de video Veo2. Si bien la mayoría de los proyectos aún se encuentran en la etapa experimental, algunos proyectos exitosos, como el recientemente lanzado oficialmente asistente de inteligencia artificial NotebookLM, se transformarán en productos completos.
Dirección de experiencia del producto: https://top.aibase.com/tool/whisk
Destacar:
Google lanza Whisk, la primera herramienta de IA generativa basada en imágenes.
Los usuarios pueden cargar o generar imágenes para un diseño visual rápido en lugar de una edición precisa.
Actualmente, la prueba está limitada a usuarios de los Estados Unidos y temporalmente no está disponible para otros países.
Con todo, Whisk, como una novedosa herramienta de generación de imágenes de IA lanzada por Google Labs, proporciona a los usuarios una forma más intuitiva y rápida de crear arte. Aunque todavía se encuentra en la etapa de prueba, su potencial es enorme y su desarrollo futuro vale la pena. esperando con ansias. Esperamos que Whisk se expanda a usuarios globales en el futuro y optimice aún más su funcionalidad y rendimiento.