更新 v0.2 :修复了连接到 florence2 节点的错误节点
2024 年 8 月 11 日更新:经过一番摆弄后,我找到了一种使用 controlnet 重现高质量图像的方法,正如他们在 Github/HF 页面上演示的那样,我还发现这 2 种采样方法可以组合并重新组织为一个更简单、更有效的方法,我将很快更新 v0.3 以包含所有这些更改。
我在 ComfyUI 中创建了一个一体化 FluxDev 工作流程,它结合了使用 FluxDev 模型生成图像的各种技术,包括 img-to-img 和 text-to-img。此工作流程可以使用 LoRA、ControlNet,通过 Ksampler 启用负面提示、动态阈值、修复等。请注意,这不是使用这些技术的“正确”方式,而是我根据可用信息的个人解释。
大量使用 USE Everywhere 节点
此工作流程在很大程度上依赖于 USE Everywhere 节点,使其尽可能干净高效地满足我的日常生成需求。我正在与社区分享此工作流程,以收集见解和改进建议。请随意自己尝试。
ComfyUI/models/clip
中):flux_text_encodersae.sft
放在ComfyUI/models/vae
中):ae.safetensorsComfyUI/models/controlnet
下,如果需要,打开文件夹)ComfyUI/models/loras
下,如果需要,打开文件夹)低 VRAM 设置:
使用“--lowvram”参数启动 ComfyUI(添加到您的 .bat 文件)以将文本编码器卸载到 CPU
创建此工作流程时,有两个可用的 ControlNet 和多个 LoRA,包括:
我只测试了 XLabs-AI 的 Canny 和 Realism LoRA,以下是一些关键要点:
git checkout xlabs_flux_controlnet
具有动态阈值的 Ksampler 工作流程基于官方 ComfyUI 博客文章。我引用:
请注意,对于这两种模型,您可以将SamplerCustomAdvanced
与BasicGuider
一起使用,或者如果您使用KSampler
,则将CFG
设置为1
。您可以在 Dev 模型上使用新的FluxGuidance
来控制类似 CFG 的蒸馏值。 (建议将其设置为 2,以实现真实感或更好的风格控制)这些模型经过训练,可以在没有真实 CFG 的情况下工作。但这并不是说您永远不能使用 CFG - 事实上,社区已经迅速利用 ComfyUI 作为实验平台来测试各种技巧,以充分利用新模型。 (比如使用 Dynamic Thresholding 自定义节点,或者使用新的FluxGuidance
内置节点进行补偿,并启用 CFG 和负提示。还有内置的ModelSamplingFlux
来控制 Flux sigma 偏移,尽管其好处比较有限。)
请记住,这是我自己的解释,请随意进行任何更改和实验。
使用此采样方法进行 0 次非樱桃选择演示:
您可以在此处找到该存储库。
像素分辨率计算器是我昨天在 LLama3.1 的帮助下开发的自定义节点(是的,我没有编程技能,从头开始学习)。它只是一个非常简单的节点,可以根据您选择的百万像素和宽高比生成最接近的“潜在友好”像素分辨率。我从原始 Flux 演示工作流程中的 ImageScaleToTotalPixels 节点中获得了灵感,因为每个人似乎都在谈论像素分辨率,而不是像 SDXL 中那样谈论宽度和高度像素计数。还有一个节点可将潜在样本输入转换为宽度和高度像素数。
还包括升级工作流程。它使用影响包中的迭代升级(图像)节点和平铺扩散来创建高分辨率修复,例如使用您选择的升级模型进行升级和细节化节点组。您还可以使用 PK 挂钩进行降噪、CFG 和步骤调度。
演示图像比较在这里。
由于目前还没有针对 Flux 训练的修复模型,因此这里只能实现最简单形式的修复。您还可以尝试合并 ControlNet,但要注意基于平方的分辨率和制导比例 (4)。
只需一些简单的节点即可运行 ollama 和 Florence2,以便使用 Vision LLm 进行详细字幕并获得及时的见解,我在演示中使用 LLaVa 13B 和 Florence2 Large,您将需要 Ollama 、 Ollama ComfyUI 和 Florence2 ComfyUI 节点,请参阅链接详细的使用和安装指南。
如果人们觉得难以使用,将添加更详细的指南......
Flux 是一个非常灵活的模型,鉴于它是第一个版本,它非常令人印象深刻。发布后两周内,已经有 ControlNet 和 LoRA 可用,这表明社区对这种模型的喜爱程度。我现在期待一些修复模型。最重要的是,Matteo,请发布一款适用于 Flux 的 iPadapter...拜托,缺少一个谜题,我就完成了...
快乐生成!
PS 我添加了与 LLama3.1 一起使用的提示,以帮助我无缘无故地对此存储库进行拼写检查和语法检查:
担任具有强大写作技巧并对一般写作有深刻理解的专业作家。根据要求协助用户重写、重新格式化以及执行语法和拼写检查。您的任务应包括:
另外,请:
这些要求你了解吗?