阿里巴巴開源了其最新的圖像生成模型Qwen2vl-Flux,該模型功能強大,支援圖像編輯、融合、混合等多種操作,並能根據用戶提供的圖像或文本生成高度相似的全新圖像。 Downcodes小編帶你深入了解這款令人驚豔的AI模型,看看它究竟有哪些令人稱讚的功能。 它不僅能根據單張圖片產生多角度、多情感的影像,還能將圖片與文字巧妙融合,甚至實現不同影像間的無縫融合,例如角色合體或場景轉換。更令人驚訝的是,它還具備網格風格遷移功能,讓使用者對影像進行精細化控制,實現更具創意的影像創作。
近日,阿里巴巴宣布開源其最新研發的圖像生成模型Qwen2vl-Flux,該模型不僅具備編輯、融合和混合等多種功能,還能夠在用戶輸入圖像或文本的情況下,生成具有高度相似性的全新圖像。
Qwen2vl-Flux 提供了強大的影像變化功能。使用者只需輸入一張圖像,無需任何文字提示,模型便能根據原圖產生多幅相似的圖像。例如,使用者上傳一張人物照片,模型便可產生多個角度下的人物表現,展現出不同的視角與情感。
模型還支援文字引導圖像混合。當使用者輸入圖片並附加相關文字提示時,Qwen2vl-Flux 能夠將輸入影像與文字內容進行巧妙融合,創造出新的影像效果。
除了上述功能,Qwen2vl-Flux 還具備影像引導影像混合的能力。使用者可以將兩張不同的影像結合在一起,實現角色合體或場景轉換。例如,將一個角色與另一個背景結合,模型能夠無縫融合兩者,形成新的視覺效果。
模型的網格風格遷移功能使得使用者能夠對影像進行細緻的控制。使用者可以對影像的特定部分進行修改,實現精細化創作。例如,在一幅展現高科技與自然環境結合的影像中,使用者可以加入生物發光技術的細節,或是森林晨霧的效果,展現出更豐富的視覺體驗。
專案入口:https://huggingface.co/Djrango/Qwen2vl-Flux
Qwen2vl-Flux 的開源,為影像生成領域帶來了新的可能性,也為開發者提供了強大的工具。 其多樣的功能和便利的操作,使其在影像編輯和創作方面具有極高的應用價值,值得期待其在未來能夠創造出更多令人驚嘆的成果!