Downcodes小编报道:阿里妈妈创意团队重磅推出全新图像生成模型FLUX.1-Turbo-Alpha,这是一个基于FLUX.1-dev模型训练的8步蒸馏Lora模型。该模型采用多头判别器,显着提升了图像生成质量,支持文本到图像生成、修复控制网等多种功能,并与Diffusers和ComfyUI框架兼容,方便用户快速上手使用。 模型在百万级高质量图像数据上进行对抗训练,美学评分超过6.3,分辨率均高于800,保证了高质量的图像输出。更令人期待的是,未来还将推出更低步数的版本。
近日,阿里妈妈创意团队发布了FLUX.1-Turbo-Alpha,这是基于FLUX.1-dev 模型训练的一款8步蒸馏Lora 模型。
该模型采用了多头判别器,显着提高了蒸馏的质量,支持文本到图像生成、修复控制网等多种FLUX 相关的应用。团队建议在使用时将引导尺度设置为3.5,Lora 尺度为1,未来还会推出更低步数的版本。
FLUX.1-Turbo-Alpha 可以直接与Diffusers 框架结合使用。用户只需通过几行代码便能加载模型并生成所需的图像。例如,你可以创建一个有趣的场景:一只微笑的树懒穿着皮夹克、牛仔帽、格子裙和蝴蝶结,站在一辆画有城市风景的光滑大众面包车前。只需简单调整参数,就能在1024x1024的分辨率下生成高质量的图像。
此外,该模型也兼容ComfyUI,可以用于文本到图像的快速工作流程,或在修复控制网中实现更高效的生成效果。通过这种技术,生成的图像能够很好地跟随原始输出,提升用户的创作体验。
FLUX.1-Turbo-Alpha 的训练过程同样令人瞩目。该模型在超过100万幅开源和内部资源的图像上进行训练,具备6.3以上的美学评分,且分辨率均高于800。团队在训练过程中采用了对抗训练的方法,以提升图像质量,并针对每个变换器层增加了多头的设计。训练过程中的引导尺度固定为3.5,时间偏移则设为3,使用了混合精度bf16,并设定学习率为2e-5,批量大小为64,图像尺寸为1024x1024。
FLUX.1-Turbo-Alpha 的推出,标志着阿里妈妈在图像生成领域的又一次突破,推动了人工智能技术的普及与应用。
项目入口:https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha
划重点:
这款模型基于FLUX.1-dev,采用8步蒸馏和多头判别器,提升图像生成质量。
支持文本到图像生成及修复控制网,用户可轻松创建多种有趣场景。
? 训练过程采用对抗训练,训练数据超过100万张图像,确保模型高质量输出。
总而言之,FLUX.1-Turbo-Alpha凭借其高效率、高质量的图像生成能力以及便捷易用的特性,为图像生成领域带来了新的可能性。 感兴趣的用户可以前往Hugging Face页面体验这款强大的模型。 Downcodes小编将持续关注阿里妈妈在人工智能领域的最新进展,为大家带来更多精彩报道。