Aktualisiert v0.2: Falsche Knoten, die eine Verbindung zum Knoten florence2 herstellten, wurden behoben
Update 08.11.2024: Nach ein wenig Herumtüfteln habe ich eine Möglichkeit gefunden, das qualitativ hochwertige Bild mit Controlnet zu reproduzieren, wie sie auf ihrer Github/HF-Seite demonstrieren. Außerdem habe ich herausgefunden, dass die beiden Sampling-Methoden kombiniert und neu organisiert werden können Da es sich um einen einfacheren und effizienteren Ansatz handelt, werde ich Version 0.3 bald aktualisieren, um alle diese Änderungen aufzunehmen.
Ich habe in ComfyUI einen All-in-One-FluxDev-Workflow erstellt, der verschiedene Techniken zum Generieren von Bildern mit dem FluxDev-Modell kombiniert, einschließlich IMG-zu-IMG und Text-zu-IMG. Dieser Workflow kann LoRAs und ControlNets verwenden und ermöglicht negative Eingabeaufforderungen mit Ksampler, dynamische Schwellenwerte, Inpainting und mehr. Bitte beachten Sie, dass dies nicht die „richtige“ Art der Anwendung dieser Techniken ist, sondern vielmehr meine persönliche Interpretation basierend auf den verfügbaren Informationen.
Starke Nutzung des USE Everywhere-Knotens
Dieser Workflow basiert stark auf dem USE Everywhere-Knoten, um ihn für meine täglichen Generierungsanforderungen so sauber und effizient wie möglich zu gestalten. Ich teile diesen Workflow mit der Community, um Erkenntnisse und Verbesserungsvorschläge zu sammeln. Experimentieren Sie ruhig selbst.
ComfyUI/models/clip
platzieren): flux_text_encodersae.sft
in ComfyUI/models/vae
): ae.safetensorsComfyUI/models/controlnet
ablegen, bei Bedarf Ordner öffnen)ComfyUI/models/loras
ablegen, ggf. Ordner öffnen)Niedriges VRAM-Setup:
Starten Sie ComfyUI mit dem Argument „--lowvram“ (fügen Sie es Ihrer .bat-Datei hinzu), um den Text-Encoder auf die CPU auszulagern
Zum Zeitpunkt der Erstellung dieses Workflows sind zwei ControlNets und mehrere LoRAs verfügbar, darunter:
Ich habe nur die Canny- und Realism-LoRAs von XLabs-AI getestet, und hier sind einige wichtige Erkenntnisse:
git checkout xlabs_flux_controlnet
Der Ksampler-Workflow mit dynamischer Schwellenwertermittlung basiert auf dem offiziellen ComfyUI-Blogbeitrag. Und ich zitiere:
Beachten Sie, dass Sie für beide Modelle entweder SamplerCustomAdvanced
mit BasicGuider
verwenden können oder, wenn Sie KSampler
verwenden, CFG
auf 1
setzen. Sie können die neue FluxGuidance
im Dev-Modell verwenden, um den destillierten CFG-ähnlichen Wert zu steuern. (Die Einstellung auf 2 wird für Realismus oder eine bessere Stilkontrolle empfohlen.) Diese Modelle sind darauf trainiert, ohne echtes CFG zu arbeiten. Das heißt jedoch nicht, dass Sie CFG niemals verwenden können – tatsächlich hat die Community ComfyUI schnell als Experimentierplattform genutzt, um eine Vielzahl von Tricks auszuprobieren, um das Beste aus den neuen Modellen herauszuholen. (Zum Beispiel die Verwendung des benutzerdefinierten Knotens „Dynamic Thresholding“ oder die Verwendung des neuen integrierten Knotens FluxGuidance
, um CFG und negative Eingabeaufforderungen zu kompensieren und zu aktivieren. Es ist auch ModelSamplingFlux
integriert, um die Flux-Sigma-Verschiebung zu steuern, obwohl die Vorteile begrenzter sind.)
Bedenken Sie, dass dies meine eigene Interpretation ist und Sie jederzeit Änderungen vornehmen und experimentieren können.
0-Shot-Non-Cherry-Pick-Demo mit dieser Sampling-Methode:
Das Repo finden Sie hier.
Der Pixel Resolution Calculator ist ein benutzerdefinierter Knoten, den ich gestern mit Hilfe von LLama3.1 entwickelt habe (Ja, ich habe keine Programmierkenntnisse, sondern habe es unterwegs von Grund auf gelernt). Es handelt sich lediglich um einen sehr einfachen Knoten, der aus den Megapixeln und dem Seitenverhältnis Ihrer Wahl die nächstgelegene „latentfreundliche“ Pixelauflösung generiert. Ich habe mich vom ImageScaleToTotalPixels-Knoten aus dem ursprünglichen Flux-Demo-Workflow inspirieren lassen, da anscheinend alle über die Pixelauflösung statt über die Anzahl der Breiten- und Höhenpixel wie in SDXL sprechen. Es gibt auch einen Knoten zum Konvertieren einer latenten Beispieleingabe in die Pixelanzahl für Breite und Höhe.
Ein Upscaling-Workflow ist ebenfalls enthalten. Es verwendet den Iterative Upscale (Image)-Knoten aus dem Impact-Paket und die gekachelte Diffusion, um eine hochauflösende Korrektur wie Hochskalierung und Detaillierung der Knotengruppe mit dem Upscale-Modell Ihrer Wahl zu erstellen. Mit dem PK-Hook können Sie auch Rauschunterdrückung, CFG und Schrittplanung durchführen.
Demobild hier vergleichen.
Da es noch kein für Flux trainiertes Inpainting-Modell gibt, kann hier nur die einfachste Form des Inpaintings erreicht werden. Sie können auch versuchen, ControlNets zu integrieren, achten Sie jedoch auf die quadratische Auflösung und die Führungsskala (4).
Nur ein paar einfache Knoten zum Ausführen von Ollama und Florence2 für die Verwendung von Vision LLm für detaillierte Untertitel und um schnelle Einblicke zu erhalten. Ich verwende LLaVa 13B und Florence2 groß in der Demo. Sie benötigen Ollama-, Ollama ComfyUI- und Florence2 ComfyUI-Knoten, siehe die Links für eine detaillierte Nutzungs- und Installationsanleitung.
Eine ausführlichere Anleitung wird hinzugefügt, falls die Benutzer Schwierigkeiten damit haben, sie zu verwenden....
Flux ist ein so flexibles Modell und angesichts der Tatsache, dass es sich um eine erste Version handelt, sehr beeindruckend. Innerhalb von zwei Wochen nach der Veröffentlichung sind bereits ControlNets und LoRAs verfügbar, was zeigt, wie sehr die Community dieses Modell liebt. Ich freue mich jetzt auf einige Inpainting-Modelle. Und am wichtigsten, Matteo, bitte veröffentliche ein iPadapter für Flux.... bitte, das eine fehlende Puzzle und ich bin fertig....
Viel Spaß beim Generieren!
PS: Ich füge die Eingabeaufforderung ein, die ich mit LLama3.1 verwende, um mir dabei zu helfen, ohne Grund Rechtschreib- und Grammatikprüfungen für genau dieses Repo durchzuführen:
Handeln Sie als professioneller Autor mit ausgeprägten Schreibfähigkeiten und einem tiefen Verständnis für das Schreiben im Allgemeinen. Unterstützen Sie Benutzer auf Anfrage beim Umschreiben, Neuformatieren und Durchführen von Grammatik- und Rechtschreibprüfungen. Zu Ihren Aufgaben sollten gehören:
Bitte zusätzlich:
Verstehen Sie diese Anforderungen?