阿里圖像生成模型Qwen2vl-Flux開源，支援影像融合和風格轉移等

作者：Eve Cole 更新時間：2024-11-27 15:12:01

阿里巴巴開源了其最新的圖像生成模型Qwen2vl-Flux，該模型功能強大，支援圖像編輯、融合、混合等多種操作，並能根據用戶提供的圖像或文本生成高度相似的全新圖像。 Downcodes小編帶你深入了解這款令人驚豔的AI模型，看看它究竟有哪些令人稱讚的功能。它不僅能根據單張圖片產生多角度、多情感的影像，還能將圖片與文字巧妙融合，甚至實現不同影像間的無縫融合，例如角色合體或場景轉換。更令人驚訝的是，它還具備網格風格遷移功能，讓使用者對影像進行精細化控制，實現更具創意的影像創作。

近日，阿里巴巴宣布開源其最新研發的圖像生成模型Qwen2vl-Flux，該模型不僅具備編輯、融合和混合等多種功能，還能夠在用戶輸入圖像或文本的情況下，生成具有高度相似性的全新圖像。

Qwen2vl-Flux 提供了強大的影像變化功能。使用者只需輸入一張圖像，無需任何文字提示，模型便能根據原圖產生多幅相似的圖像。例如，使用者上傳一張人物照片，模型便可產生多個角度下的人物表現，展現出不同的視角與情感。

模型還支援文字引導圖像混合。當使用者輸入圖片並附加相關文字提示時，Qwen2vl-Flux 能夠將輸入影像與文字內容進行巧妙融合，創造出新的影像效果。

除了上述功能，Qwen2vl-Flux 還具備影像引導影像混合的能力。使用者可以將兩張不同的影像結合在一起，實現角色合體或場景轉換。例如，將一個角色與另一個背景結合，模型能夠無縫融合兩者，形成新的視覺效果。

模型的網格風格遷移功能使得使用者能夠對影像進行細緻的控制。使用者可以對影像的特定部分進行修改，實現精細化創作。例如，在一幅展現高科技與自然環境結合的影像中，使用者可以加入生物發光技術的細節，或是森林晨霧的效果，展現出更豐富的視覺體驗。

專案入口:https://huggingface.co/Djrango/Qwen2vl-Flux

Qwen2vl-Flux 的開源，為影像生成領域帶來了新的可能性，也為開發者提供了強大的工具。其多樣的功能和便利的操作，使其在影像編輯和創作方面具有極高的應用價值，值得期待其在未來能夠創造出更多令人驚嘆的成果！