Google a lancé un nouvel outil de génération d'images IA appelé Whisk, qui change complètement la méthode traditionnelle de génération d'images. Contrairement au besoin précédent de longues descriptions textuelles, Whisk permet aux utilisateurs de télécharger directement des images sous forme de mots d'invite pour spécifier le thème, la scène et le style des images générées. Les utilisateurs peuvent fournir plusieurs images pour chacun de ces trois aspects, et Whisk intégrera intelligemment ces informations visuelles pour générer des images inattendues. Même s'il n'y a pas d'image appropriée, Whisk fournit également une fonction de génération d'image aléatoire pour aider les utilisateurs à démarrer rapidement la création.
Google a publié un nouvel outil d'IA appelé Whisk, qui bouleverse le modèle traditionnel de génération d'images et permet aux utilisateurs d'utiliser des images comme mots d'invite au lieu de longues descriptions textuelles.
Avec Whisk, vous pouvez télécharger des images pour spécifier le thème, la scène et le style des images générées par l'IA, et vous pouvez utiliser plusieurs images pour chacune des trois.
Par exemple, j'ai saisi une photo d'un cochon et une photo d'un chat, j'ai sélectionné le style d'une illustration, puis je n'ai saisi aucun mot d'invite (bien sûr, vous pouvez également choisir d'utiliser des invites de texte en même temps.) , cela m'a donné automatiquement Un tel rendu a été généré. Notez que SCENE saisit généralement des images de scène. Bien sûr, ce n'est pas grave si vous devez saisir des images de personnages comme moi. Elles seront automatiquement fusionnées et générées. Parfois, elles ne seront pas très pertinentes, mais il y aura des surprises inattendues.
Si vous n'avez pas d'image appropriée sous la main, vous pouvez cliquer sur l'icône en forme de dé pour que Google remplisse automatiquement certaines images sous forme d'invites (ces images semblent également être générées par l'IA).
J'ai cliqué avec désinvolture, et Google a donné au hasard des photos d'un chien, d'un bateau et de broderies pour voir quel genre d'effet le mélange produirait :
L'effet est plutôt bon. Les éléments des trois images sont parfaitement mélangés pour former une image de broderie intéressante.
En cliquant sur l'image, j'ai découvert que Whisk fournit également des astuces textuelles pour chaque image générée. Si vous êtes satisfait du résultat, vous pouvez enregistrer ou télécharger l'image ; si vous souhaitez l'optimiser davantage, vous pouvez ajouter plus de texte dans la zone de texte, ou cliquer directement sur l'image pour modifier l'invite de texte.
Google a souligné dans un article de blog que Whisk est conçu pour « une exploration visuelle rapide, et non une édition précise au pixel près ». La société affirme également que Whisk peut « dérailler », ce qui permet aux utilisateurs de modifier les mots d'invite sous-jacents.
J'ai joué avec l'outil Whisk pendant quelques minutes et je l'ai trouvé très intéressant. Bien que la génération d’images prenne quelques secondes un peu ennuyeuses et que les images résultantes puissent parfois paraître un peu étranges, le processus itératif est amusant.
Google a déclaré que Whisk utilise la dernière version du modèle de génération d'images Imagen3, qui a également été officiellement publiée aujourd'hui. Google a également publié un modèle de génération vidéo de nouvelle génération, Veo2, qui serait capable de comprendre le « langage unique des films » et aurait « moins » d'artefacts tels que des doigts supplémentaires. Veo2 sera lancé en premier dans VideoFX de Google, et les utilisateurs peuvent postuler pour l'essayer via une liste d'attente de Google Labs, avec des plans d'extension à YouTube Shorts et à d'autres produits l'année prochaine.
Dans l’ensemble, l’émergence de Whisk a apporté de nouvelles possibilités à la génération d’images, permettant aux utilisateurs d’exprimer leur créativité par des moyens visuels et de réaliser plus facilement une personnalisation personnalisée des images.
Adresse de l'expérience produit : https://top.aibase.com/tool/whisk
Grâce à sa méthode innovante de génération d'images, Whisk offre aux utilisateurs une expérience de création d'images plus intuitive et plus pratique, qui vaut la peine d'être essayée. Dépêchez-vous et visitez le lien pour découvrir ce puissant outil d'IA !