谷歌最新发布的图像生成模型Imagen3,现已在Gemini API上线,为开发者提供了强大的图像生成工具。该模型能够生成多种风格的高质量图像,从超现实主义到动漫角色,满足了不同用户的创意需求。Imagen3不仅提升了图像的清晰度和构图能力,还通过简化的文本提示,帮助用户更轻松地将创意转化为图像。
初期,Imagen3将只对付费用户开放,预计不久后将向免费用户逐步推出。根据官方介绍,用户只需支付每幅图像0.03美元,就可以享受 Imagen3的强大功能。同时,用户在生成图像时,可以自由控制图像的宽高比以及生成的选项数量,满足不同的需求。
为了打击虚假信息和不当归属,Imagen3生成的所有图像都带有不可见的数字水印 SynthID,这个水印可识别图像为人工智能生成的作品。此外,开发者还可以通过 Python 代码轻松实现图像生成,具体的代码示例也已在官方文档中提供。用户只需简单地设置 API 密钥、输入提示词,就能生成想要的图像,体验这一新技术的便利。
为了让用户更好地了解 Imagen3的能力,官方还展示了一系列生成的图像样本,涵盖了多种风格与主题。随着技术的不断进步,谷歌计划在不久的将来将更多的生成媒体模型整合到 Gemini API 中,进一步推动生成媒体与语言模型的结合,助力开发者创造更多有趣的应用。
博客:https://developers.googleblog.com/en/imagen-3-arrives-in-the-gemini-api/
划重点:
Imagen3现已在 Gemini API 上线,提供多种风格的高质量图像生成服务。
每幅图像生成费用为0.03美元,支持用户自定义宽高比和生成选项。
所有生成图像均带有不可见水印,以防止虚假信息传播。
Imagen3的推出标志着谷歌在生成媒体领域的又一重大突破,为开发者和创意工作者提供了更多可能性。