阿里图像生成模型Qwen2vl-Flux开源，支持图像融合和风格转移等 - AI文章

作者：Eve Cole 更新时间：2025-01-24 22:32:01

阿里巴巴开源了其最新的图像生成模型Qwen2vl-Flux，该模型具备强大的图像编辑、融合和混合功能，能够根据用户提供的图像或文本生成高度相似的全新图像。它支持多种模式，例如仅根据图像生成相似图像、文本引导图像混合以及图像引导图像混合，用户可以灵活控制图像的生成过程，实现精细化的图像创作。Qwen2vl-Flux 的出现为图像生成领域带来了新的可能性，其开源特性也方便了更多开发者和研究人员的使用。本文将详细介绍Qwen2vl-Flux 的主要功能和应用场景。

近日，阿里巴巴宣布开源其最新研发的图像生成模型 Qwen2vl-Flux，该模型不仅具备编辑、融合和混合等多种功能，还能够在用户输入图像或文本的情况下，生成具有高度相似性的全新图像。

Qwen2vl-Flux 提供了强大的图像变化功能。用户只需输入一张图像，无需任何文本提示，模型便能根据原图生成多幅相似的图像。例如，用户上传一张人物照片，模型便可以生成多个角度下的人物表现，展现出不同的视角与情感。

模型还支持文本引导图像混合。当用户输入一张图片并附加相关文本提示时，Qwen2vl-Flux 能够将输入图像与文本内容进行巧妙融合，创造出新的图像效果。

除了上述功能，Qwen2vl-Flux 还具备图像引导图像混合的能力。用户可以将两张不同的图像结合在一起，实现角色合体或场景转换。例如，将一个角色与另一个背景相结合，模型能够无缝融合两者，形成新的视觉效果。

模型的网格风格迁移功能使得用户能够对图像进行细致的控制。用户可以对图像的特定部分进行修改，实现精细化创作。比如，在一幅展现高科技与自然环境结合的图像中，用户可以添加生物发光技术的细节，或者森林晨雾的效果，展现出更加丰富的视觉体验。

项目入口:https://huggingface.co/Djrango/Qwen2vl-Flux

划重点:

Qwen2vl-Flux 开源，具备强大的图像生成和编辑能力。

支持图像变化和文本引导图像混合，创造出全新视觉效果。

提供图像引导图像混合和网格风格迁移，允许用户进行精细控制。

总而言之，Qwen2vl-Flux凭借其强大的功能和开源特性，为图像生成和编辑领域带来了显著的进步，值得期待其在未来的应用和发展。感兴趣的读者可以访问项目入口进行体验和学习。