Google Labs a récemment lancé Whisk, un outil de génération d'art basé sur l'IA basé sur l'image, apportant une nouvelle expérience à la création artistique. Contrairement aux outils de génération d'images traditionnels avec invites textuelles, Whisk permet aux utilisateurs de télécharger ou de générer directement des images dans l'outil et de spécifier des thèmes, des scènes et des styles pour réaliser une création artistique plus intuitive. Les utilisateurs peuvent mélanger et assortir différents composants et affiner les invites textuelles pour produire des œuvres d'art uniques et créatives. La technologie derrière Whisk est une combinaison du puissant modèle linguistique de Google et du modèle de génération d'images, qui peut capturer les caractéristiques essentielles de l'image au lieu de simplement la copier.
Google Labs a récemment lancé Whisk, son dernier outil d'expérimentation d'intelligence artificielle générative, aux États-Unis. Contrairement aux outils de génération d'images traditionnels qui s'appuient principalement sur des invites textuelles, Whisk se concentre sur l'utilisation d'images comme méthode de saisie, permettant aux utilisateurs de créer des œuvres d'art de manière plus intuitive.
Les utilisateurs peuvent télécharger des images directement sur Whisk ou générer des images dans l'outil, en spécifiant des éléments tels que le thème, la scène et le style. Le système Whisk permet aux utilisateurs de mélanger et d'associer ces composants et d'affiner si nécessaire à l'aide d'invites textuelles supplémentaires.
Il convient de noter qu’en coulisses, le modèle linguistique de Google (probablement le Gemini 2.0 Flash récemment publié) génère automatiquement une description détaillée de l’image d’entrée. Ces descriptions seront intégrées au dernier modèle de génération d'images de Google, Imagen3, qui capture les caractéristiques essentielles du sujet plutôt que de créer une réplique exacte.
AIbase a effectué de nombreux tests. Après avoir téléchargé les trois images de gauche, elles peuvent être fusionnées pour générer le résultat de droite. L'effet est plutôt bon et la jouabilité est très élevée. comme suit:
Cependant, comme Whisk n'extrait que quelques éléments clés de chaque image source, Google avertit les utilisateurs que les résultats de l'image résultante peuvent différer des attentes. Par exemple, l'image résultante peut différer de l'image originale en termes de taille, de poids, de coiffure ou de couleur de peau.
Google affirme que ces détails sont souvent essentiels au succès d'un projet. Ils permettent donc aux utilisateurs d'afficher et de modifier les invites textuelles qui pilotent le processus de génération d'images.
Les premiers testeurs, dont certains artistes et professionnels de la création, affirment que Whisk ressemble plus à un nouvel outil de création qu'à un éditeur d'images traditionnel. Google espère que l'outil aidera les utilisateurs à effectuer rapidement un brainstorming visuel plutôt qu'une édition précise, permettant aux utilisateurs de générer et de filtrer rapidement plusieurs options avant d'enregistrer leurs œuvres préférées.
Après des tests préliminaires, même si Whisk est très agréable à utiliser, il nécessite néanmoins quelques secondes d'attente pour que chaque nouvelle image soit générée. Ces retards sont probablement dus au trafic élevé, alors que les utilisateurs affluent pour essayer le nouvel outil.
Actuellement, Whisk n'est disponible que pour les utilisateurs aux États-Unis, et les utilisateurs peuvent l'essayer gratuitement et partager leurs commentaires sur labs.google/whisk. Quant aux utilisateurs des autres pays, ils ne peuvent temporairement pas accéder à cet outil.
Whisk fait partie de Google Labs, qui est le terrain d'essai de Google pour tester ses projets d'IA, notamment Gemini, Imagen et le dernier modèle vidéo Veo2. Alors que la plupart des projets sont encore au stade expérimental, certains projets réussis, tels que l'assistant d'IA récemment publié officiellement NotebookLM, seront transformés en produits complets.
Adresse de l'expérience produit : https://top.aibase.com/tool/whisk
Souligner:
Google lance Whisk, le premier outil d'IA générative basé sur l'image.
Les utilisateurs peuvent télécharger ou générer des images pour une conception visuelle rapide plutôt qu'une édition précise.
L'essai est actuellement limité aux utilisateurs aux États-Unis et est temporairement inaccessible aux autres pays.
Dans l'ensemble, Whisk, en tant que nouvel outil de génération d'images IA lancé par Google Labs, offre aux utilisateurs un moyen plus intuitif et plus rapide de créer de l'art. Bien qu'il soit encore en phase de test, son potentiel est énorme et son développement futur en vaut la peine. avec impatience. Nous sommes impatients de voir Whisk s'étendre aux utilisateurs du monde entier à l'avenir et d'optimiser davantage ses fonctionnalités et ses performances.