>>> Klicken Sie hier, um Fooocus zu installieren <<<
Fooocus ist eine Bildgenerierungssoftware (basierend auf Gradio).
Fooocus präsentiert ein Umdenken bei der Gestaltung von Bildgeneratoren. Die Software ist offline, Open Source und kostenlos. Gleichzeitig sind, ähnlich wie bei vielen Online-Bildgeneratoren wie Midjourney, keine manuellen Anpassungen erforderlich, und Benutzer müssen sich nur auf die Eingabeaufforderungen und Bilder konzentrieren. Fooocus hat auch die Installation vereinfacht: Zwischen dem Drücken von „Download“ und dem Generieren des ersten Bildes ist die Anzahl der erforderlichen Mausklicks streng auf weniger als 3 begrenzt. Der minimale GPU-Speicherbedarf beträgt 4 GB (Nvidia).
In letzter Zeit gibt es bei Google viele gefälschte Websites, wenn Sie nach „fooocus“ suchen. Vertrauen Sie denen nicht – hier ist die einzige offizielle Quelle von Fooocus.
Das Fooocus-Projekt, das vollständig auf der Stable Diffusion XL -Architektur basiert, befindet sich derzeit in einem Zustand begrenzter Langzeitunterstützung (LTS) mit ausschließlich Fehlerbehebungen. Da die vorhandenen Funktionalitäten als nahezu frei von programmatischen Problemen gelten (Dank der enormen Bemühungen von mashb1t), werden sich zukünftige Updates ausschließlich auf die Behebung eventuell auftretender Fehler konzentrieren.
Derzeit gibt es keine Pläne, auf neuere Modellarchitekturen zu migrieren oder diese zu integrieren. Dies kann sich jedoch im Laufe der Zeit mit der Entwicklung der Open-Source-Community ändern. Wenn sich die Community beispielsweise auf eine einzige vorherrschende Methode zur Bildgenerierung konvergiert (was nach dem aktuellen Stand tatsächlich in einem halben oder einem Jahr der Fall sein kann), könnte Fooocus auch zu genau dieser Methode migrieren.
Für diejenigen, die an der Nutzung neuerer Modelle wie Flux interessiert sind, empfehlen wir die Erkundung alternativer Plattformen wie WebUI Forge (ebenfalls von uns), ComfyUI/SwarmUI. Darüber hinaus stehen mehrere hervorragende Fooocus-Forks zum Experimentieren zur Verfügung.
Auch hier gibt es in letzter Zeit viele gefälschte Websites bei Google, wenn Sie nach „fooocus“ suchen. Erhalten Sie Fooocus NICHT von diesen Websites – diese Seite ist die einzige offizielle Quelle von Fooocus. Wir haben niemals Websites wie „fooocus.com“, „fooocus.net“, „fooocus.co“, „fooocus.ai“, „fooocus.org“, „fooocus.pro“, „fooocus.one“. Diese Websites sind ALLE FAKE. Sie haben ABSOLUT keine Beziehung zu uns. Fooocus ist eine zu 100 % nichtkommerzielle Offline-Open-Source-Software.
Unten finden Sie eine kurze Liste mit Beispielen von Midjourney:
Mitten auf der Reise | Fooocus |
---|---|
Text-zu-Bild in hoher Qualität, ohne dass viel schnelles Engineering oder Parameter-Tuning erforderlich ist. (Unbekannte Methode) | Text-zu-Bild in hoher Qualität, ohne dass viel schnelles Engineering oder Parameter-Tuning erforderlich ist. (Fooocus verfügt über eine Offline-GPT-2-basierte Eingabeaufforderungsverarbeitungs-Engine und zahlreiche Sampling-Verbesserungen, sodass die Ergebnisse immer schön sind, unabhängig davon, ob Ihre Eingabeaufforderung nur „Haus im Garten“ oder nur 1000 Wörter lang ist.) |
V1 V2 V3 V4 | Eingabebild -> Hochskalieren oder Variation -> Variieren (subtil) / Variieren (stark) |
U1 U2 U3 U4 | Eingabebild -> Upscale oder Variation -> Upscale (1,5x) / Upscale (2x) |
Inpaint / Oben / Unten / Links / Rechts (Schwenken) | Eingabebild -> Inpaint oder Outpaint -> Inpaint / Oben / Unten / Links / Rechts (Fooocus verwendet seinen eigenen Inpaint-Algorithmus und seine eigenen Inpaint-Modelle, sodass die Ergebnisse zufriedenstellender sind als alle andere Software, die die standardmäßige SDXL-Inpaint-Methode/das Standard-SDXL-Inpaint-Modell verwendet.) |
Bildaufforderung | Eingabebild -> Bildaufforderung (Fooocus verwendet seinen eigenen Bildaufforderungsalgorithmus, sodass die Ergebnisqualität und das schnelle Verständnis zufriedenstellender sind als alle andere Software, die Standard-SDXL-Methoden wie Standard-IP-Adapter oder Revisionen verwendet.) |
--Stil | Erweitert -> Stil |
--stilisieren | Erweitert -> Erweitert -> Anleitung |
--niji | Mehrere Launcher: „run.bat“, „run_anime.bat“ und „run_realistic.bat“. Fooocus unterstützt SDXL-Modelle auf Civitai (Sie können bei Google nach „Civitai“ suchen, wenn Sie es nicht wissen) |
--Qualität | Erweitert -> Qualität |
--wiederholen | Erweitert -> Bildnummer |
Mehrere Eingabeaufforderungen (::) | Verwenden Sie einfach mehrere Eingabezeilen |
Schnelle Gewichte | Sie können „Ich bin (glücklich:1,5)“ verwenden. Fooocus verwendet den Neugewichtungsalgorithmus von A1111, sodass die Ergebnisse besser sind als bei ComfyUI, wenn Benutzer Eingabeaufforderungen direkt von Civitai kopieren. (Denn wenn Eingabeaufforderungen in der Neugewichtung von ComfyUI geschrieben werden, ist es weniger wahrscheinlich, dass Benutzer Eingabeaufforderungstexte kopieren, da sie das Ziehen von Dateien bevorzugen.) Um die Einbettung zu verwenden, können Sie „(embedding:file_name:1.1)“ verwenden. |
--NEIN | Erweitert -> Negative Eingabeaufforderung |
--ar | Erweitert -> Seitenverhältnisse |
InsightFace | Eingabebild -> Bildaufforderung -> Erweitert -> FaceSwap |
Beschreiben | Eingabebild -> Beschreiben |
Nachfolgend finden Sie eine kurze Liste anhand der Beispiele von LeonardoAI:
LeonardoAI | Fooocus |
---|---|
Schnelle Magie | Erweitert -> Stil -> Fooocus V2 |
Erweiterte Sampler-Parameter (wie Kontrast/Schärfe usw.) | Erweitert -> Erweitert -> Sampling-Schärfe / etc |
Benutzerfreundliche ControlNets | Eingabebild -> Bildaufforderung -> Erweitert |
Klicken Sie auch hier, um die erweiterten Funktionen zu durchsuchen.
Sie können Fooocus direkt herunterladen mit:
>>> Klicken Sie hier, um es herunterzuladen <<<
Nachdem Sie die Datei heruntergeladen haben, dekomprimieren Sie sie bitte und führen Sie dann „run.bat“ aus.
Wenn Sie die Software zum ersten Mal starten, werden automatisch Modelle heruntergeladen:
Bei unterschiedlichen Voreinstellungen werden Standardmodelle in den Ordner „Fooocusmodelscheckpoints“ heruntergeladen. Sie können sie vorab herunterladen, wenn Sie keinen automatischen Download wünschen.
Beachten Sie, dass bei Verwendung von Inpaint beim ersten Malen eines Bildes das eigene Inpaint-Steuerungsmodell von Fooocus von hier als Datei „Fooocusmodelsinpaintinpaint_v26.fooocus.patch“ heruntergeladen wird (die Größe dieser Datei beträgt 1,28 GB).
Nach Fooocus 2.1.60 werden Sie auch run_anime.bat
und run_realistic.bat
haben. Es handelt sich um unterschiedliche Modellvoreinstellungen (und erfordern unterschiedliche Modelle, werden aber automatisch heruntergeladen). Weitere Einzelheiten finden Sie hier.
Ab Fooocus 2.3.0 können Sie Presets auch direkt im Browser wechseln. Denken Sie daran, diese Argumente hinzuzufügen, wenn Sie das Standardverhalten ändern möchten:
Verwenden Sie --disable-preset-selection
, um die Voreinstellungsauswahl im Browser zu deaktivieren.
Verwenden Sie --always-download-new-model
um fehlende Modelle auf den voreingestellten Schalter herunterzuladen. Standard ist der Fallback auf previous_default_models
die in der entsprechenden Voreinstellung definiert sind, siehe auch Terminalausgabe.
Wenn Sie diese Dateien bereits haben, können Sie sie an die oben genannten Speicherorte kopieren, um die Installation zu beschleunigen.
Beachten Sie, dass Ihre Modelldateien beschädigt sind, wenn Sie „MetadataIncompleteBuffer“ oder „PytorchStreamReader“ sehen. Bitte laden Sie die Modelle erneut herunter.
Nachfolgend finden Sie einen Test auf einem relativ preisgünstigen Laptop mit 16 GB System-RAM und 6 GB VRAM (Nvidia 3060-Laptop). Die Geschwindigkeit auf dieser Maschine beträgt etwa 1,35 Sekunden pro Iteration. Ziemlich beeindruckend – heutzutage sind Laptops mit 3060 in der Regel zu einem sehr akzeptablen Preis erhältlich.
Außerdem berichten in letzter Zeit viele andere Softwareprogramme, dass der Nvidia-Treiber über 532 manchmal 10x langsamer ist als der Nvidia-Treiber 531. Wenn Ihre Generierungszeit sehr lang ist, sollten Sie den Nvidia-Treiber 531 Laptop oder den Nvidia-Treiber 531 Desktop herunterladen.
Beachten Sie, dass die Mindestanforderung 4 GB Nvidia GPU-Speicher (4 GB VRAM) und 8 GB Systemspeicher (8 GB RAM) beträgt. Hierzu ist die Verwendung der Virtual Swap-Technik von Microsoft erforderlich, die in den meisten Fällen automatisch durch Ihre Windows-Installation aktiviert wird, sodass Sie häufig nichts dagegen unternehmen müssen. Wenn Sie sich jedoch nicht sicher sind, es manuell deaktiviert haben (würde das wirklich jemand tun?) oder „RuntimeError: CPUAllocator“ angezeigt wird , können Sie es hier aktivieren:
Und stellen Sie sicher, dass Sie auf jedem Laufwerk mindestens 40 GB freien Speicherplatz haben, wenn immer noch „RuntimeError: CPUAllocator“ angezeigt wird!
Bitte öffnen Sie ein Problem, wenn Sie ähnliche Geräte verwenden, aber dennoch keine akzeptablen Leistungen erzielen können.
Beachten Sie, dass die Mindestanforderungen für verschiedene Plattformen unterschiedlich sind.
Sehen Sie sich hier auch die häufigsten Probleme und Fehlerbehebungen an.
(Zuletzt getestet – 12. August 2024 von mashb1t)
Colab | Info |
---|---|
Fooocus-Beamter |
In Colab können Sie die letzte Zeile in !python entry_with_update.py --share --always-high-vram
oder !python entry_with_update.py --share --always-high-vram --preset anime
oder !python entry_with_update.py --share --always-high-vram --preset realistic
für Fooocus Default/Anime/Realistic Edition.
Sie können die Voreinstellung auch in der Benutzeroberfläche ändern. Bitte beachten Sie, dass dies nach 60 Sekunden zu Timeouts führen kann. Wenn dies der Fall ist, warten Sie bitte, bis der Download abgeschlossen ist, ändern Sie die Voreinstellung auf „Anfänglich“ und kehren Sie zu der von Ihnen ausgewählten zurück oder laden Sie die Seite neu.
Beachten Sie, dass dieses Colab den Refiner standardmäßig deaktiviert, da die Ressourcen von Colab Free relativ begrenzt sind (und einige „große“ Funktionen wie die Bildaufforderung dazu führen können, dass die Verbindung zu Colab im Free-Tarif getrennt wird). Wir stellen sicher, dass die grundlegende Text-zu-Bild-Funktion immer auf der kostenlosen Colab-Version funktioniert.
Die Verwendung von --always-high-vram
verschiebt die Ressourcenzuweisung von RAM auf VRAM und erreicht die insgesamt beste Balance zwischen Leistung, Flexibilität und Stabilität auf der Standard-T4-Instanz. Weitere Informationen finden Sie hier.
Danke an Camenduru für die Vorlage!
Wenn Sie Anaconda/Miniconda verwenden möchten, können Sie dies tun
git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus conda env create -f environment.yaml conda activate fooocus pip install -r requirements_versions.txt
Laden Sie dann die Modelle herunter: Laden Sie die Standardmodelle in den Ordner „Fooocusmodelscheckpoints“ herunter. Oder lassen Sie Fooocus die Modelle automatisch über den Launcher herunterladen :
conda activate fooocus python entry_with_update.py
Oder, wenn Sie einen Remote-Port öffnen möchten, verwenden Sie
conda activate fooocus python entry_with_update.py --listen
Verwenden Sie python entry_with_update.py --preset anime
oder python entry_with_update.py --preset realistic
für Fooocus Anime/Realistic Edition.
Auf Ihrem Linux muss Python 3.10 installiert sein. Nehmen wir an, Ihr Python kann mit dem Befehl python3 aufgerufen werden, während Ihr venv-System funktioniert. du kannst
git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus python3 -m venv fooocus_env source fooocus_env/bin/activate pip install -r requirements_versions.txt
Modell-Downloads finden Sie in den obigen Abschnitten. Sie können die Software starten mit:
source fooocus_env/bin/activate python entry_with_update.py
Oder, wenn Sie einen Remote-Port öffnen möchten, verwenden Sie
source fooocus_env/bin/activate python entry_with_update.py --listen
Verwenden Sie python entry_with_update.py --preset anime
oder python entry_with_update.py --preset realistic
für Fooocus Anime/Realistic Edition.
Wenn Sie wissen, was Sie tun, und auf Ihrem Linux bereits Python 3.10 installiert ist und Ihr Python mit dem Befehl python3 (und Pip mit pip3 ) aufgerufen werden kann, können Sie dies tun
git clone https://github.com/lllyasviel/Fooocus.git cd Fooocus pip3 install -r requirements_versions.txt
Modell-Downloads finden Sie in den obigen Abschnitten. Sie können die Software starten mit:
python3 entry_with_update.py
Oder, wenn Sie einen Remote-Port öffnen möchten, verwenden Sie
python3 entry_with_update.py --listen
Verwenden Sie python entry_with_update.py --preset anime
oder python entry_with_update.py --preset realistic
für Fooocus Anime/Realistic Edition.
Beachten Sie, dass die Mindestanforderungen für verschiedene Plattformen unterschiedlich sind.
Das Gleiche gilt für die obige Anleitung. Sie müssen Torch auf die AMD-Version umstellen
pip uninstall torch torchvision torchaudio torchtext functorch xformers pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.6
AMD wird allerdings nicht intensiv getestet. Die AMD-Unterstützung befindet sich in der Betaphase.
Verwenden Sie python entry_with_update.py --preset anime
oder python entry_with_update.py --preset realistic
für Fooocus Anime/Realistic Edition.
Beachten Sie, dass die Mindestanforderungen für verschiedene Plattformen unterschiedlich sind.
Das Gleiche gilt für Windows. Laden Sie die Software herunter und bearbeiten Sie den Inhalt von run.bat
wie folgt:
.python_embededpython.exe -m pip uninstall torch torchvision torchaudio torchtext functorch xformers -y .python_embededpython.exe -m pip install torch-directml .python_embededpython.exe -s Fooocusentry_with_update.py --directml pause
Führen Sie dann run.bat
aus.
AMD wird allerdings nicht intensiv getestet. Die AMD-Unterstützung befindet sich in der Betaphase.
Verwenden Sie für AMD .python_embededpython.exe entry_with_update.py --directml --preset anime
oder .python_embededpython.exe entry_with_update.py --directml --preset realistic
für Fooocus Anime/Realistic Edition.
Beachten Sie, dass die Mindestanforderungen für verschiedene Plattformen unterschiedlich sind.
Mac wird nicht intensiv getestet. Nachfolgend finden Sie eine inoffizielle Richtlinie für die Verwendung von Mac. Hier können Sie Probleme besprechen.
Sie können Fooocus auf Apple Mac Silicon (M1 oder M2) mit macOS „Catalina“ oder einer neueren Version installieren. Fooocus läuft auf Apple-Siliziumcomputern über die PyTorch MPS-Gerätebeschleunigung. Mac Silicon-Computer sind nicht mit einer dedizierten Grafikkarte ausgestattet, was zu deutlich längeren Bildverarbeitungszeiten im Vergleich zu Computern mit dedizierten Grafikkarten führt.
Installieren Sie jeden Abend den Conda-Paketmanager und Pytorch. Anweisungen dazu finden Sie im Apple-Entwicklerleitfaden „Accelerated PyTorch Training on Mac“. Stellen Sie sicher, dass Pytorch Ihr MPS-Gerät erkennt.
Öffnen Sie die macOS-Terminal-App und klonen Sie dieses Repository mit git clone https://github.com/lllyasviel/Fooocus.git
.
Wechseln Sie in das neue Fooocus-Verzeichnis, cd Fooocus
.
Erstellen Sie eine neue Conda-Umgebung, conda env create -f environment.yaml
.
Aktivieren Sie Ihre neue Conda-Umgebung, conda activate fooocus
.
Installieren Sie die von Fooocus benötigten Pakete, pip install -r requirements_versions.txt
.
Starten Sie Fooocus, indem Sie python entry_with_update.py
ausführen. (Einige Mac M2-Benutzer benötigen möglicherweise python entry_with_update.py --disable-offload-from-vram
um das Laden/Entladen von Modellen zu beschleunigen.) Wenn Sie Fooocus zum ersten Mal ausführen, werden die Stable Diffusion SDXL-Modelle automatisch heruntergeladen und es dauert eine Weile Dauer, abhängig von Ihrer Internetverbindung.
Verwenden Sie python entry_with_update.py --preset anime
oder python entry_with_update.py --preset realistic
für Fooocus Anime/Realistic Edition.
Siehe docker.md
Die Richtlinien finden Sie hier.
Nachfolgend finden Sie die Mindestanforderungen für die lokale Ausführung von Fooocus. Wenn die Leistungsfähigkeit Ihres Geräts unter dieser Spezifikation liegt, können Sie Fooocus möglicherweise nicht lokal verwenden. (Bitte teilen Sie uns auf jeden Fall mit, wenn die Leistungsfähigkeit Ihres Geräts geringer ist, Fooocus aber weiterhin funktioniert.)
Betriebssystem | GPU | Minimaler GPU-Speicher | Minimaler Systemspeicher | Systemtausch | Notiz |
---|---|---|---|---|---|
Windows/Linux | Nvidia RTX 4XXX | 4 GB | 8 GB | Erforderlich | am schnellsten |
Windows/Linux | Nvidia RTX 3XXX | 4 GB | 8 GB | Erforderlich | normalerweise schneller als RTX 2XXX |
Windows/Linux | Nvidia RTX 2XXX | 4 GB | 8 GB | Erforderlich | normalerweise schneller als GTX 1XXX |
Windows/Linux | Nvidia GTX 1XXX | 8 GB (* 6 GB unsicher) | 8 GB | Erforderlich | nur unwesentlich schneller als die CPU |
Windows/Linux | Nvidia GTX 9XX | 8 GB | 8 GB | Erforderlich | schneller oder langsamer als die CPU |
Windows/Linux | Nvidia GTX < 9XX | Nicht unterstützt | / | / | / |
Windows | AMD-GPU | 8 GB (aktualisiert am 30. Dezember 2023) | 8 GB | Erforderlich | über DirectML (* ROCm ist in der Warteschleife), etwa 3x langsamer als Nvidia RTX 3XXX |
Linux | AMD-GPU | 8 GB | 8 GB | Erforderlich | über ROCm, etwa 1,5x langsamer als Nvidia RTX 3XXX |
Mac | M1/M2 MPS | Geteilt | Geteilt | Geteilt | etwa 9x langsamer als Nvidia RTX 3XXX |
Windows/Linux/Mac | Verwenden Sie nur CPU | 0 GB | 32 GB | Erforderlich | etwa 17x langsamer als Nvidia RTX 3XXX |
* AMD GPU ROCm (in der Warteschleife): AMD arbeitet weiterhin an der Unterstützung von ROCm unter Windows.
* Nvidia GTX 1XXX 6 GB unsicher: Einige Leute berichten von Erfolg mit 6 GB auf der GTX 10XX, andere berichten jedoch von Fehlern.
Beachten Sie, dass Fooocus nur für die Generierung von Bildern mit extrem hoher Qualität geeignet ist. Wir werden keine kleineren Modelle unterstützen, um die Anforderungen zu reduzieren und die Ergebnisqualität zu beeinträchtigen.
Sehen Sie sich hier die häufigsten Probleme an.
Aufgrund unterschiedlicher Ziele sind die Standardmodelle und Konfigurationen von Fooocus unterschiedlich:
Aufgabe | Windows | Linux-Argumente | Hauptmodell | Veredler | Konfig |
---|---|---|---|---|---|
Allgemein | run.bat | juggernautXL_v8Rundiffusion | nicht verwendet | Hier | |
Realistisch | run_realistic.bat | --voreingestellt realistisch | RealisticStockPhoto_v20 | nicht verwendet | Hier |
Anime | run_anime.bat | --voreingestellter Anime | animaPencilXL_v500 | nicht verwendet | Hier |
Beachten Sie, dass der Download automatisch erfolgt. Sie müssen nichts tun, wenn die Internetverbindung in Ordnung ist. Sie können sie jedoch manuell herunterladen, wenn Sie über eine eigene Vorbereitung verfügen (oder sie von einem anderen Ort verschieben).
Zusätzlich zur Ausführung auf localhost kann Fooocus seine Benutzeroberfläche auch auf zwei Arten verfügbar machen:
Lokaler UI-Listener: Verwenden Sie --listen
(geben Sie den Port an, z. B. mit --port 8888
).
API-Zugriff: Verwenden Sie --share
(registriert einen Endpunkt bei .gradio.live
).
In beiden Fällen erfolgt der Zugriff standardmäßig nicht authentifiziert. Sie können eine Basisauthentifizierung hinzufügen, indem Sie im Hauptverzeichnis eine Datei namens auth.json
erstellen, die eine Liste von JSON-Objekten mit den Schlüsseln user
und pass
enthält (siehe Beispiel in auth-example.json).
GPT2-basierte Prompt-Erweiterung als dynamischer Stil „Fooocus V2“. (ähnlich dem versteckten Vorverarbeitungs- und „Roh“-Modus von Midjourney oder dem Prompt Magic von LeonardoAI).
Nativer Refiner-Austausch innerhalb eines einzigen K-Samplers. Der Vorteil besteht darin, dass das Refiner-Modell nun den Impuls des Basismodells (oder die ODE-Verlaufsparameter) aus der k-Abtastung wiederverwenden kann, um eine kohärentere Abtastung zu erreichen. Im hochauflösenden Fix von Automatic1111 und im Knotensystem von ComfyUI verwenden das Basismodell und der Refiner zwei unabhängige K-Sampler, was bedeutet, dass der Impuls größtenteils verschwendet wird und die Sampling-Kontinuität unterbrochen wird. Fooocus verwendet sein eigenes fortschrittliches K-Diffusions-Sampling, das einen nahtlosen, nativen und kontinuierlichen Austausch in einem Refiner-Setup gewährleistet. (Update 13. August: Eigentlich habe ich das vor einigen Tagen mit Automatic1111 besprochen, und es scheint, dass der „native Refiner Swap innerhalb eines einzigen K-Samplers“ in den Entwicklungszweig von Webui integriert ist. Großartig!)
Negative ADM-Anleitung. Da die höchste Auflösungsstufe von XL Base keine Queraufmerksamkeiten aufweist, können die positiven und negativen Signale für die höchste Auflösungsstufe von XL während der CFG-Abtastung nicht genügend Kontraste erhalten, was dazu führt, dass die Ergebnisse in bestimmten Fällen etwas plastisch oder übermäßig glatt aussehen. Da die höchste Auflösungsstufe des XL glücklicherweise immer noch vom Bildseitenverhältnis (ADM) abhängig ist, können wir den Adm auf der positiven/negativen Seite modifizieren, um den Mangel an CFG-Kontrast in der höchsten Auflösungsstufe auszugleichen. (Update vom 16. August, die IOS-App Draw Things unterstützt negative ADM-Anleitungen. Großartig!)
Wir haben eine sorgfältig abgestimmte Variante von Abschnitt 5.1 von „Verbesserung der Probenqualität von Diffusionsmodellen mithilfe von Self-Attention Guidance“ implementiert. Das Gewicht ist auf sehr niedrig eingestellt, aber dies ist die letzte Garantie von Fooocus, um sicherzustellen, dass der XL niemals ein übermäßig glattes oder plastisches Aussehen erhält (Beispiele hier). Dadurch können nahezu alle Fälle ausgeschlossen werden, in denen XL auch bei negativer ADM-Führung gelegentlich noch zu glatte Ergebnisse liefert. (Update 2023, 18. August, der Gaußsche Kernel von SAG wurde in einen anisotropen Kernel geändert, um eine bessere Strukturerhaltung und weniger Artefakte zu gewährleisten.)
Wir haben die Stilvorlagen etwas modifiziert und den „cinematic-default“ hinzugefügt.
Wir haben „sd_xl_offset_example-lora_1.0.safetensors“ getestet und es scheint, dass die Ergebnisse immer besser sind als bei XL ohne Lora, wenn das Lora-Gewicht unter 0,5 liegt.
Die Parameter der Probenehmer werden sorgfältig abgestimmt.
Da XL die Positionskodierung zur Generierung der Auflösung verwendet, sehen Bilder, die mit mehreren festen Auflösungen generiert wurden, etwas besser aus als solche mit beliebigen Auflösungen (da die Positionskodierung nicht sehr gut im Umgang mit int-Zahlen ist, die während des Trainings nicht sichtbar sind). Dies deutet darauf hin, dass die Auflösungen in der Benutzeroberfläche möglicherweise fest codiert sind, um optimale Ergebnisse zu erzielen.
Getrennte Eingabeaufforderungen für zwei verschiedene Text-Encoder scheinen unnötig. Getrennte Eingabeaufforderungen für das Basismodell und den Refiner funktionieren möglicherweise, die Auswirkungen sind jedoch zufällig, und wir sehen davon ab, dies zu implementieren.
Die DPM-Familie scheint für XL gut geeignet zu sein, da XL manchmal eine übermäßig glatte Textur erzeugt, die DPM-Familie jedoch manchmal zu dichte Texturdetails. Ihre gemeinsame Wirkung wirkt auf die menschliche Wahrnehmung neutral und ansprechend.
Ein sorgfältig entwickeltes System zum Ausbalancieren mehrerer Stile sowie zur schnellen Erweiterung.
Verwendung der Methode von automatic1111 zur Normalisierung der Hervorhebung von Aufforderungen. Dies verbessert die Ergebnisse erheblich, wenn Benutzer Eingabeaufforderungen direkt aus civitai kopieren.
Das gemeinsame Swap-System des Refiners unterstützt nun auch img2img und upscale nahtlos.
CFG-Skala und TSNR-Korrektur (abgestimmt auf SDXL), wenn CFG größer als 10 ist.
Nachdem Sie Fooocus zum ersten Mal ausgeführt haben, wird eine Konfigurationsdatei unter Fooocusconfig.txt
generiert. Diese Datei kann bearbeitet werden, um den Modellpfad oder die Standardparameter zu ändern.
Eine bearbeitete Fooocusconfig.txt
(diese Datei wird nach dem ersten Start generiert) könnte beispielsweise so aussehen:
{ "path_checkpoints": "D:Fooocusmodelscheckpoints", "path_loras": "D:Fooocusmodelsloras", "path_embeddings": "D:Fooocusmodelsembeddings", "path_vae_ approx": „D:Fooocusmodelsvae_ approx“, „path_upscale_models“: „D:Fooocusmodelsupscale_models“, „path_inpaint“: „D:Fooocusmodelsinpaint“, „path_controlnet“: „D:Fooocus modelscontrolnet", "path_clip_vision": "D:Fooocusmodelsclip_vision", "path_fooocus_expansion": "D:Fooocusmodelsprompt_expansionfooocus_expansion", "path_outputs": "D:Fooocusoutputs" , "default_model": "realisticStockPhoto_v10.safetensors", "default_refiner": "", "default_loras": [["lora_filename_1.safetensors", 0.5], ["lora_filename_2.safetensors", 0.5]], "default_cfg_scale": 3.0, „default_sampler“: „dpmpp_2m“, „default_scheduler“: „karras“, „default_negative_prompt“: „low quality“, „default_positive_prompt“: „“, „default_styles“: [ „Fooocus V2“, „Fooocus Photograph“, „Fooocus Negative " ] }
Viele andere Schlüssel, Formate und Beispiele finden Sie in Fooocusconfig_modification_tutorial.txt
(diese Datei wird nach dem ersten Start generiert).
Überlegen Sie es sich zweimal, bevor Sie die Konfiguration wirklich ändern. Wenn Sie feststellen, dass etwas kaputt geht, löschen Sie einfach Fooocusconfig.txt
. Fooocus wird auf die Standardeinstellungen zurückgesetzt.
Eine sicherere Möglichkeit besteht darin, einfach „run_anime.bat“ oder „run_realistic.bat“ auszuprobieren – sie sollten bereits für verschiedene Aufgaben gut genug sein.
Beachten Sie, dass user_path_config.txt
veraltet ist und bald entfernt wird. (Bearbeiten: Es wurde bereits entfernt.)
entry_with_update.py [-h] [--listen [IP]] [--port PORT] [--disable-header-check [ORIGIN]] [--web-upload-size WEB_UPLOAD_SIZE] [--hf-mirror HF_MIRROR] [--external-working-path PATH [PATH ...]] [--output-path OUTPUT_PATH] [--temp-path TEMP_PATH] [--cache-path CACHE_PATH] [--in-browser] [--disable-in-browser] [--gpu-device-id DEVICE_ID] [--async-cuda-allocation | --disable-async-cuda-allocation] [--disable-attention-upcast] [--all-in-fp32 | --all-in-fp16] [--unet-in-bf16 | --unet-in-fp16 | --unet-in-fp8-e4m3fn | --unet-in-fp8-e5m2] [--vae-in-fp16 | --vae-in-fp32 | --vae-in-bf16] [--vae-in-cpu] [--clip-in-fp8-e4m3fn | --clip-in-fp8-e5m2 | --clip-in-fp16 | --clip-in-fp32] [--directml [DIRECTML_DEVICE]] [--disable-ipex-hijack] [--preview-option [none,auto,fast,taesd]] [--attention-split | --attention-quad | --attention-pytorch] [--disable-xformers] [--always-gpu | --always-high-vram | --always-normal-vram | --always-low-vram | --always-no-vram | --always-cpu [CPU_NUM_THREADS]] [--always-offload-from-vram] [--pytorch-deterministic] [--disable-server-log] [--debug-mode] [--is-windows-embedded-python] [--disable-server-info] [--multi-user] [--share] [--preset PRESET] [--disable-preset-selection] [--language LANGUAGE] [--disable-offload-from-vram] [--theme THEME] [--disable-image-log] [--disable-analytics] [--disable-metadata] [--disable-preset-download] [--disable-enhance-output-sorting] [--enable-auto-describe-image] [--always-download-new-model] [--rebuild-hash-cache [CPU_NUM_THREADS]]
Beispielaufforderung: __color__ flower
Für positive und negative Eingabeaufforderungen verarbeitet.
Wählt einen zufälligen Platzhalter aus einer vordefinierten Liste von Optionen aus, in diesem Fall die Datei wildcards/color.txt
. Der Platzhalter wird durch eine zufällige Farbe ersetzt (Zufälligkeit basierend auf dem Startwert). Sie können die Zufälligkeit auch deaktivieren und eine Platzhalterdatei von oben nach unten verarbeiten, indem Sie im Entwickler-Debug-Modus das Kontrollkästchen Read wildcards in order
aktivieren.
Platzhalter können verschachtelt und kombiniert werden, und mehrere Platzhalter können in derselben Eingabeaufforderung verwendet werden (Beispiel siehe wildcards/color_flower.txt
).
Beispielaufforderung: [[red, green, blue]] flower
Wird nur bei positiver Aufforderung verarbeitet.
Verarbeitet das Array von links nach rechts und generiert für jedes Element im Array ein separates Bild. In diesem Fall würden 3 Bilder generiert, eines für jede Farbe. Erhöhen Sie die Bildanzahl auf 3, um alle 3 Varianten zu generieren.
Arrays können nicht verschachtelt werden, aber mehrere Arrays können in derselben Eingabeaufforderung verwendet werden. Unterstützt Inline-LoRAs als Array-Elemente!
Beispielaufforderung: flower
Wird nur bei positiver Aufforderung verarbeitet.
Wendet eine LoRA auf die Eingabeaufforderung an. Die LoRA-Datei muss sich im Verzeichnis models/loras
befinden.
Klicken Sie hier, um die erweiterten Funktionen zu durchsuchen.
Unten sind einige Forks zu Fooocus:
Fooocus' Gabeln |
---|
fenneishi/Fooocus-Control runew0lf/RuinedFooocus MoonRide303/Fooocus-MRE metercai/SimpleSDXL mashb1t/Fooocus und so weiter ... |
Vielen Dank an twri und 3Diva und Marc K3nt3L für die Erstellung zusätzlicher SDXL-Stile, die in Fooocus verfügbar sind.
Das Projekt beginnt mit einer Mischung aus Stable Diffusion WebUI- und ComfyUI-Codebasen.
Vielen Dank auch an daswer123 für den Beitrag zum Canvas-Zoom!
Das Protokoll ist hier.
Sie können JSON-Dateien im language
ablegen, um die Benutzeroberfläche zu übersetzen.
Nachfolgend finden Sie beispielsweise den Inhalt von Fooocus/language/example.json
:
{ „Generate“: „生成“, „Input Image“: „入力画像“, „Advanced“: „고급“, „SAI 3D Model“: „SAI 3D Modèle“}
Wenn Sie das Argument --language example
hinzufügen, liest Fooocus Fooocus/language/example.json
um die Benutzeroberfläche zu übersetzen.
Sie können beispielsweise die Endzeile von Windows run.bat
als bearbeiten
.python_embededpython.exe -s Fooocusentry_with_update.py --language example
Oder run_anime.bat
als
.python_embededpython.exe -s Fooocusentry_with_update.py --language example --preset anime
Oder run_realistic.bat
als
.python_embededpython.exe -s Fooocusentry_with_update.py --language example --preset realistic
Für die praktische Übersetzung können Sie Ihre eigene Datei wie Fooocus/language/jp.json
oder Fooocus/language/cn.json
erstellen und dann das Flag --language jp
oder --language cn
verwenden. Anscheinend existieren diese Dateien jetzt nicht. Für die Erstellung dieser Dateien benötigen wir Ihre Hilfe!
Beachten Sie, dass Fooocus immer Fooocus/language/default.json
zur Übersetzung lädt, wenn kein --language
angegeben ist und gleichzeitig Fooocus/language/default.json
vorhanden ist. Standardmäßig ist die Datei Fooocus/language/default.json
nicht vorhanden.