O Google Labs lançou recentemente o Whisk, uma ferramenta de geração de arte com IA baseada em imagens, trazendo uma nova experiência para a criação artística. Ao contrário das ferramentas tradicionais de geração de imagens com prompts de texto, o Whisk permite aos usuários fazer upload ou gerar imagens diretamente dentro da ferramenta e especificar temas, cenas e estilos para obter uma criação artística mais intuitiva. Os usuários podem misturar e combinar diferentes componentes e fazer ajustes com instruções de texto para produzir obras de arte exclusivas e criativas. A tecnologia por trás do Whisk é uma combinação do poderoso modelo de linguagem e do modelo de geração de imagens do Google, que pode capturar as características essenciais da imagem em vez de simplesmente copiá-la.
O Google Labs lançou recentemente o Whisk, sua mais recente ferramenta experimental de inteligência artificial generativa, nos Estados Unidos. Ao contrário das ferramentas tradicionais de geração de imagens que dependem principalmente de prompts de texto, o Whisk se concentra no uso de imagens como método de entrada, permitindo aos usuários criar obras de arte de forma mais intuitiva.
Os usuários podem fazer upload de imagens diretamente para o Whisk ou gerar imagens dentro da ferramenta, especificando elementos como tema, cena e estilo. O sistema Whisk permite aos usuários misturar e combinar esses componentes e fazer ajustes conforme necessário usando prompts de texto adicionais.
É importante notar que, nos bastidores, o modelo de linguagem do Google (provavelmente o recém-lançado Gemini 2.0 Flash) gera automaticamente uma descrição detalhada da imagem de entrada. Essas descrições serão inseridas no mais recente modelo de geração de imagens do Google, Imagen3, que captura as características essenciais do sujeito em vez de criar uma réplica exata.
AIbase realizou muitos testes. Depois de enviar as três imagens à esquerda, ela pode ser fundida para gerar o resultado à direita. O efeito é muito bom e a jogabilidade é muito alta. do seguinte modo:
No entanto, como o Whisk extrai apenas alguns elementos-chave de cada imagem de origem, o Google alerta os usuários que os resultados da imagem resultante podem diferir das expectativas. Por exemplo, a imagem resultante pode diferir da imagem original em altura, peso, penteado ou cor da pele.
O Google afirma que esses detalhes costumam ser críticos para o sucesso de um projeto, por isso permite que os usuários visualizem e editem os prompts de texto que orientam o processo de geração de imagens.
Os primeiros testadores, incluindo alguns artistas e profissionais criativos, dizem que o Whisk parece mais uma nova ferramenta criativa do que um editor de imagens tradicional. O Google espera que a ferramenta ajude os usuários a realizar brainstormings visuais rapidamente, em vez de edições precisas, permitindo que os usuários gerem e filtrem rapidamente várias opções antes de salvar seus trabalhos favoritos.
Após testes preliminares, embora o Whisk seja muito agradável de usar, são necessários alguns segundos de espera para que cada nova imagem seja gerada. Esses atrasos provavelmente se devem ao alto tráfego, à medida que os usuários se aglomeram para experimentar a nova ferramenta.
Atualmente, o Whisk está disponível apenas para usuários nos Estados Unidos, e os usuários podem experimentá-lo gratuitamente e compartilhar comentários em labs.google/whisk. Já os usuários de outros países estão temporariamente impossibilitados de acessar esta ferramenta.
Whisk faz parte do Google Labs, que é o campo de provas do Google para testar seus projetos de IA, incluindo Gemini, Imagen e o mais recente modelo de vídeo Veo2. Embora a maioria dos projetos ainda esteja em fase experimental, alguns projetos bem-sucedidos, como o recentemente lançado oficialmente assistente de IA NotebookLM, serão transformados em produtos completos.
Endereço de experiência do produto: https://top.aibase.com/tool/whisk
Destaque:
Google lança Whisk, a primeira ferramenta de IA generativa baseada em imagens.
Os usuários podem fazer upload ou gerar imagens para design visual rápido, em vez de edição precisa.
O teste está atualmente limitado a usuários nos Estados Unidos e está temporariamente inacessível para outros países.
Resumindo, o Whisk, como uma nova ferramenta de geração de imagens de IA lançada pelo Google Labs, oferece aos usuários uma maneira mais intuitiva e rápida de criar arte. Embora ainda esteja em fase de testes, seu potencial é enorme e seu desenvolvimento futuro vale a pena. ansioso por. Esperamos que o Whisk se expanda para usuários globais no futuro e otimize ainda mais sua funcionalidade e desempenho.