谷歌推出全新AI工具Whisk 无需提示词，可多张图片混合生成新风格图像

作者：Eve Cole 更新时间：2024-12-18 20:48:01

谷歌推出了全新AI图像生成工具Whisk，它彻底改变了传统的图像生成方式。不同于以往需要冗长的文字描述，Whisk允许用户直接上传图片作为提示词，以此指定生成的图像主题、场景和风格。用户可以分别为这三方面提供多张图片，Whisk会巧妙地将这些视觉信息融合，生成令人意想不到的图像。即使没有合适的图片，Whisk也提供随机图片生成功能，帮助用户快速启动创作。

谷歌发布了一款名为Whisk的新AI工具，它颠覆了传统的图像生成模式，允许用户使用图片作为提示词，而非冗长的文字描述。

通过Whisk，你可以上传图片来指定AI生成图像的主题、场景和风格，并且可以为这三者分别使用多张图片。

比如，我输入了一张小猪的图片和猫咪的图片，样式选择了一张插画的风格，然后什么提示词都没输入（当然，你也可以选择同时使用文字提示。），它自动给我生成了这样一张效果图。注意，SCENE这里一般都是输入场景图，当然非要和我一样输入角色图片也没问题，它会自动融合生成，有时候可能相关性不大，但会有意外的惊喜。

如果你手头没有合适的图片，可以点击骰子图标，让谷歌自动填充一些图片作为提示(这些图片似乎也是AI生成的)。

我随手点了一下，谷歌随机给了一只狗和一只小船，还有刺绣的图片，看看会混合出什么样的效果：

效果还不错，三张图片的元素完美融合在了一起，成了一幅有趣的刺绣图~

点击图像，我发现Whisk还为每张生成的图片提供了文字提示。如果对结果满意，你可以收藏或下载图像;如果想要进一步优化，可以在文本框中添加更多文字，或直接点击图像编辑文字提示。

谷歌在博客文章中强调，Whisk旨在进行“快速的视觉探索，而非像素级的精确编辑”。该公司还表示，Whisk可能会“跑偏”，因此允许用户编辑底层的提示词。

我体验了Whisk工具几分钟，发现它非常有趣。虽然图像生成需要几秒钟的时间，略显烦人，而且生成的图像有时会有些奇怪，但迭代过程很有意思。

谷歌表示，Whisk使用了最新版本的Imagen3图像生成模型，该模型也在今天正式发布。谷歌还同时发布了新一代视频生成模型Veo2，据说它能够理解“电影的独特语言”，并且“更少”出现诸如多余手指之类的幻觉。Veo2将首先在谷歌的VideoFX中推出，用户可以通过谷歌实验室的候补名单申请体验，并计划在明年扩展到YouTube Shorts和其他产品。

总而言之，Whisk的出现为图像生成带来了全新的可能性，让用户可以通过视觉方式表达创意，更加便捷地实现图像的个性化定制。

产品体验地址：https://top.aibase.com/tool/whisk

Whisk以其创新的图像生成方式，为用户提供了一种更直观、更便捷的图像创作体验，值得一试。赶紧访问链接体验这款强大的AI工具吧！