O Google lançou uma nova ferramenta de geração de imagens de IA chamada Whisk, que muda completamente a forma tradicional de geração de imagens. Ao contrário da necessidade anterior de descrições de texto extensas, o Whisk permite que os usuários carreguem imagens diretamente como palavras de alerta para especificar o tema, cena e estilo das imagens geradas. Os usuários podem fornecer várias imagens para cada um desses três aspectos, e o Whisk integrará de forma inteligente essas informações visuais para gerar imagens inesperadas. Mesmo que não haja uma imagem adequada, o Whisk também oferece uma função de geração aleatória de imagens para ajudar os usuários a iniciar a criação rapidamente.
O Google lançou uma nova ferramenta de IA chamada Whisk, que subverte o modelo tradicional de geração de imagens e permite aos usuários usar imagens como palavras de alerta em vez de longas descrições de texto.
Com o Whisk, você pode fazer upload de imagens para especificar o tema, a cena e o estilo das imagens geradas por IA, e pode usar várias imagens para cada uma das três.
Por exemplo, inseri a imagem de um porco e a imagem de um gato, selecionei o estilo de uma ilustração e, em seguida, não inseri nenhuma palavra de prompt (é claro, você também pode optar por usar prompts de texto ao mesmo tempo). , isso me deu automaticamente Essa renderização foi gerada. Observe que o SCENE geralmente insere imagens de cenas. Claro, não há problema se você tiver que inserir imagens de personagens como eu. Às vezes, pode não ser muito relevante, mas haverá surpresas inesperadas.
Se você não tiver uma imagem adequada em mãos, pode clicar no ícone do dado para que o Google preencha automaticamente algumas imagens como prompts (essas imagens também parecem ser geradas por IA).
Cliquei casualmente e o Google deu aleatoriamente fotos de um cachorro, um barco e bordados para ver que tipo de efeito a mistura produziria:
O efeito é muito bom. Os elementos das três imagens são perfeitamente combinados para formar uma imagem de bordado interessante.
Clicando na imagem, descobri que o Whisk também fornece dicas de texto para cada imagem gerada. Se estiver satisfeito com o resultado, você pode salvar ou baixar a imagem; se quiser otimizá-la ainda mais, pode adicionar mais texto na caixa de texto ou clicar diretamente na imagem para editar o prompt de texto.
O Google enfatizou em uma postagem no blog que o Whisk foi projetado para “exploração visual rápida, não edição com precisão de pixels”. A empresa também diz que o Whisk pode “sair do caminho”, permitindo que os usuários editem as palavras subjacentes.
Brinquei com a ferramenta Whisk por alguns minutos e achei muito interessante. Embora a geração de imagens demore alguns segundos um pouco irritantes e as imagens resultantes às vezes possam parecer um pouco estranhas, o processo iterativo é divertido.
O Google disse que o Whisk usa a versão mais recente do modelo de geração de imagens Imagen3, que também foi lançado oficialmente hoje. O Google também lançou um modelo de geração de vídeo de nova geração, Veo2, que é considerado capaz de entender a "linguagem única dos filmes" e ter "menos" artefatos, como dedos extras. O Veo2 será lançado primeiro no VideoFX do Google, e os usuários podem se inscrever para experimentá-lo por meio de uma lista de espera do Google Labs, com planos de expansão para o YouTube Shorts e outros produtos no próximo ano.
Em suma, o surgimento do Whisk trouxe novas possibilidades para a geração de imagens, permitindo aos usuários expressar sua criatividade por meios visuais e obter de forma mais conveniente a personalização personalizada das imagens.
Endereço de experiência do produto: https://top.aibase.com/tool/whisk
Com seu método inovador de geração de imagens, o Whisk oferece aos usuários uma experiência de criação de imagens mais intuitiva e conveniente, que vale a pena experimentar. Apresse-se e visite o link para experimentar esta poderosa ferramenta de IA!