谷歌近日向美国用户推出其图像生成工具Imagen3的升级版,该工具可在谷歌的Test Kitchen平台上访问。Imagen3在图像细节、光影效果和减少伪影方面均有显著提升,其易用性也得到了改进。用户只需输入文字描述即可生成图像,并可对图像局部进行编辑。虽然Imagen3在生成公众人物图像和武器图像方面有限制,但用户仍可通过巧妙的描述生成类似图像,这引发了关于内容过滤和生成式AI能力的讨论。
据VentureBeat报道,谷歌在今年5月份的I/O大会上首次宣布了新版Imagen3的发布,但该工具直到最近几天才通过Vertex平台正式向公众开放。上周,一些Reddit用户已经开始试用Imagen3,并分享了他们的体验,谷歌也在本周二发布了相关的研究论文。Imagen3的使用方式非常简单,用户只需根据提示输入描述,即可生成详细的图像。同时,用户还可以通过突出显示图像中的某一部分并描述需要修改的内容,来对图像进行编辑。需要注意的是,该工具在生成图像时存在一定的限制,例如它无法生成公众人物的图像,如泰勒·斯威夫特,也不会生成武器的图像。此外,虽然它不能生成特定的受版权保护的角色形象,但用户可以通过描述性语言绕过这些限制,轻松创建相似的角色形象。有用户反馈称,他们通过该工具生成了与刺猬索尼克、马里奥等角色非常相似的图像,甚至还生成了苹果、梅西百货和好时等公司的徽标,这些图像效果令人印象深刻。尽管Imagen3具备一定的内容过滤功能,但它与埃隆·马斯克的X平台上另一款图像生成工具Grok仍存在显著差异。Grok曾被用于生成包含毒品、暴力内容及公众人物形象的图片,这些内容引发了广泛的争议。不过,谷歌的图像生成工具也并非毫无问题。今年早些时候,谷歌曾停止让用户使用其聊天工具生成图像,因为有用户发现该工具生成的图像与历史事实不符,引发了批评。
Imagen3的推出展现了谷歌在图像生成技术上的持续进步,同时也引发了人们对AI生成内容的伦理和安全性的思考。未来,如何更好地平衡AI的创造力和潜在风险将成为一个重要的课题。