谷歌推出了全新AI图像生成工具Whisk,它彻底改变了传统的图像生成方式。不同于以往需要冗长的文字描述,Whisk允许用户直接上传图片作为提示词,以此指定生成的图像主题、场景和风格。用户可以分别为这三方面提供多张图片,Whisk会巧妙地将这些视觉信息融合,生成令人意想不到的图像。即使没有合适的图片,Whisk也提供随机图片生成功能,帮助用户快速启动创作。
谷歌发布了一款名为Whisk的新AI工具,它颠覆了传统的图像生成模式,允许用户使用图片作为提示词,而非冗长的文字描述。
通过Whisk,你可以上传图片来指定AI生成图像的主题、场景和风格,并且可以为这三者分别使用多张图片。
比如,我输入了一张小猪的图片和猫咪的图片,样式选择了一张插画的风格,然后什么提示词都没输入(当然,你也可以选择同时使用文字提示。),它自动给我生成了这样一张效果图。注意,SCENE这里一般都是输入场景图,当然非要和我一样输入角色图片也没问题,它会自动融合生成,有时候可能相关性不大,但会有意外的惊喜。
如果你手头没有合适的图片,可以点击骰子图标,让谷歌自动填充一些图片作为提示(这些图片似乎也是AI生成的)。
我随手点了一下,谷歌随机给了一只狗和一只小船,还有刺绣的图片,看看会混合出什么样的效果:
效果还不错,三张图片的元素完美融合在了一起,成了一幅有趣的刺绣图~
点击图像,我发现Whisk还为每张生成的图片提供了文字提示。如果对结果满意,你可以收藏或下载图像;如果想要进一步优化,可以在文本框中添加更多文字,或直接点击图像编辑文字提示。
谷歌在博客文章中强调,Whisk旨在进行“快速的视觉探索,而非像素级的精确编辑”。该公司还表示,Whisk可能会“跑偏”,因此允许用户编辑底层的提示词。
我体验了Whisk工具几分钟,发现它非常有趣。虽然图像生成需要几秒钟的时间,略显烦人,而且生成的图像有时会有些奇怪,但迭代过程很有意思。
谷歌表示,Whisk使用了最新版本的Imagen3图像生成模型,该模型也在今天正式发布。谷歌还同时发布了新一代视频生成模型Veo2,据说它能够理解“电影的独特语言”,并且“更少”出现诸如多余手指之类的幻觉。Veo2将首先在谷歌的VideoFX中推出,用户可以通过谷歌实验室的候补名单申请体验,并计划在明年扩展到YouTube Shorts和其他产品。
总而言之,Whisk的出现为图像生成带来了全新的可能性,让用户可以通过视觉方式表达创意,更加便捷地实现图像的个性化定制。
产品体验地址:https://top.aibase.com/tool/whisk
Whisk以其创新的图像生成方式,为用户提供了一种更直观、更便捷的图像创作体验,值得一试。 赶紧访问链接体验这款强大的AI工具吧!