谷歌推出了全新AI影像產生工具Whisk,它徹底改變了傳統的影像產生方式。有別於以往需要冗長的文字描述,Whisk允許使用者直接上傳圖片作為提示詞,以此指定所產生的圖像主題、場景和風格。使用者可以分別為這三方面提供多張圖片,Whisk會巧妙地將這些視覺訊息融合,產生令人意想不到的圖像。即使沒有合適的圖片,Whisk也提供隨機圖片產生功能,幫助使用者快速啟動創作。
谷歌發布了一款名為Whisk的新AI工具,它顛覆了傳統的圖像生成模式,允許用戶使用圖片作為提示詞,而不是冗長的文字描述。
透過Whisk,你可以上傳圖片來指定AI生成圖像的主題、場景和風格,並且可以為這三者分別使用多張圖片。
例如,我輸入了一張小豬的圖片和貓咪的圖片,樣式選擇了一張插畫的風格,然後什麼提示詞都沒輸入(當然,你也可以選擇同時使用文字提示。),它自動給我產生了這樣一張效果圖。注意,SCENE這裡通常都是輸入場景圖,當然非要跟我一樣輸入角色圖片也沒問題,它會自動融合生成,有時候可能相關性不大,但會有意外的驚喜。
如果你手邊沒有合適的圖片,可以點擊骰子圖標,讓谷歌自動填充一些圖片作為提示(這些圖片似乎也是AI生成的)。
我隨手點了一下,谷歌隨機給了一隻狗和一艘小船,還有刺繡的圖片,看看會混合出什麼樣的效果:
效果還不錯,三張圖片的元素完美融合在了一起,成了一幅有趣的刺繡圖~
點擊圖像,我發現Whisk也為每張生成的圖片提供了文字提示。如果對結果滿意,你可以收藏或下載圖像;如果想要進一步優化,可以在文本框中添加更多文字,或直接點擊圖像編輯文字提示。
谷歌在部落格文章中強調,Whisk旨在進行「快速的視覺探索,而非像素級的精確編輯」。該公司還表示,Whisk可能會“偏離”,因此允許用戶編輯底層的提示詞。
我體驗了Whisk工具幾分鐘,發現它非常有趣。雖然圖像生成需要幾秒鐘的時間,略顯煩人,而且生成的圖像有時會有些奇怪,但迭代過程很有趣。
谷歌表示,Whisk使用了最新版本的Imagen3影像生成模型,該模型也在今天正式發布。谷歌還同時發布了新一代視頻生成模型Veo2,據說它能夠理解“電影的獨特語言”,並且“更少”出現諸如多餘手指之類的幻覺。 Veo2將首先在Google的VideoFX中推出,用戶可以透過谷歌實驗室的候補名單申請體驗,並計劃在明年擴展到YouTube Shorts和其他產品。
總而言之,Whisk的出現為影像生成帶來了全新的可能性,讓使用者可以透過視覺方式表達創意,更方便地實現影像的個人化。
產品體驗網址:https://top.aibase.com/tool/whisk
Whisk以其創新的圖像生成方式,為用戶提供了更直觀、更便捷的圖像創作體驗,值得一試。 趕快造訪連結體驗這款強大的AI工具吧!