阿里圖像生成模型Qwen2vl-Flux開源，支援圖像融合和風格轉移等- AI文章

作者：Eve Cole 更新時間：2025-01-24 22:32:01

阿里巴巴開源了其最新的圖像生成模型Qwen2vl-Flux，該模型具備強大的圖像編輯、融合和混合功能，能夠根據用戶提供的圖像或文本生成高度相似的全新圖像。它支援多種模式，例如僅根據圖像生成相似圖像、文字引導圖像混合以及圖像引導圖像混合，用戶可以靈活控制圖像的生成過程，實現精細化的圖像創作。 Qwen2vl-Flux 的出現為影像生成領域帶來了新的可能性，其開源特性也方便了更多開發者和研究人員的使用。本文將詳細介紹Qwen2vl-Flux 的主要功能與應用場景。

近日，阿里巴巴宣布開源其最新研發的圖像生成模型Qwen2vl-Flux，該模型不僅具備編輯、融合和混合等多種功能，還能夠在用戶輸入圖像或文本的情況下，生成具有高度相似性的全新圖像。

Qwen2vl-Flux 提供了強大的影像變化功能。使用者只需輸入一張圖像，無需任何文字提示，模型便能根據原圖產生多幅相似的圖像。例如，使用者上傳一張人物照片，模型便可產生多個角度下的人物表現，展現出不同的視角與情感。

模型還支援文字引導圖像混合。當使用者輸入圖片並附加相關文字提示時，Qwen2vl-Flux 能夠將輸入影像與文字內容進行巧妙融合，創造出新的影像效果。

除了上述功能，Qwen2vl-Flux 還具備影像引導影像混合的能力。使用者可以將兩張不同的影像結合在一起，實現角色合體或場景轉換。例如，將一個角色與另一個背景結合，模型能夠無縫融合兩者，形成新的視覺效果。

模型的網格風格遷移功能使得使用者能夠對影像進行細緻的控制。使用者可以對影像的特定部分進行修改，實現精細化創作。例如，在一幅展現高科技與自然環境結合的影像中，使用者可以加入生物發光技術的細節，或是森林晨霧的效果，展現出更豐富的視覺體驗。

專案入口:https://huggingface.co/Djrango/Qwen2vl-Flux

劃重點:

Qwen2vl-Flux 開源，具備強大的影像生成和編輯能力。

支援圖像變化和文字引導圖像混合，創造出全新視覺效果。

提供影像引導影像混合和網格風格遷移，讓使用者進行精細控制。

總而言之，Qwen2vl-Flux憑藉其強大的功能和開源特性，為影像生成和編輯領域帶來了顯著的進步，值得期待其在未來的應用和發展。有興趣的讀者可以訪問專案入口進行體驗和學習。