谷歌最新發布的圖像生成模型Imagen3,現已在Gemini API上線,為開發者提供了強大的圖像生成工具。該模型能夠生成多種風格的高質量圖像,從超現實主義到動漫角色,滿足了不同用戶的創意需求。 Imagen3不僅提升了圖像的清晰度和構圖能力,還通過簡化的文本提示,幫助用戶更輕鬆地將創意轉化為圖像。
初期,Imagen3將只對付費用戶開放,預計不久後將向免費用戶逐步推出。根據官方介紹,用戶只需支付每幅圖像0.03美元,就可以享受Imagen3的強大功能。同時,用戶在生成圖像時,可以自由控製圖像的寬高比以及生成的選項數量,滿足不同的需求。
為了打擊虛假信息和不當歸屬,Imagen3生成的所有圖像都帶有不可見的數字水印SynthID,這個水印可識別圖像為人工智能生成的作品。此外,開發者還可以通過Python 代碼輕鬆實現圖像生成,具體的代碼示例也已在官方文檔中提供。用戶只需簡單地設置API 密鑰、輸入提示詞,就能生成想要的圖像,體驗這一新技術的便利。
為了讓用戶更好地了解Imagen3的能力,官方還展示了一系列生成的圖像樣本,涵蓋了多種風格與主題。隨著技術的不斷進步,谷歌計劃在不久的將來將更多的生成媒體模型整合到Gemini API 中,進一步推動生成媒體與語言模型的結合,助力開發者創造更多有趣的應用。
博客:https://developers.googleblog.com/en/imagen-3-arrives-in-the-gemini-api/
劃重點:
Imagen3現已在Gemini API 上線,提供多種風格的高質量圖像生成服務。
每幅圖像生成費用為0.03美元,支持用戶自定義寬高比和生成選項。
所有生成圖像均帶有不可見水印,以防止虛假信息傳播。
Imagen3的推出標誌著谷歌在生成媒體領域的又一重大突破,為開發者和創意工作者提供了更多可能性。