Da der ByteDance-Artikel mit dem Titel „MagicMix: Semantic Mixing with Diffusion Models“ (https://arxiv.org/abs/2210.16056) seinen Code nicht veröffentlicht hat, habe ich hier ein Jupyter-Notebook implementiert, damit Sie es ausprobieren können.
Das Notebook implementiert eine Funktion namens magic_mix
, die den Pfad zu einem Bild und die Eingabeaufforderung übernimmt, an die sich das Bild anpassen soll.
Zusätzliche optionale Parameter:
nu: steuert, wie stark die Eingabeaufforderung das Originalbild in der anfänglichen Layoutphase überschreiben soll. Wenn Ihr Ergebnis dem Originalbild zu nahe kommt, versuchen Sie, diesen Parameter zu erhöhen.
total_steps: Anzahl der Inferenzschritte für eine stabile Diffusion
Guidance_scale: Dies ist die kostenlose Anleitung für den Klassifikator. Je höher dieser Wert eingestellt ist, desto mehr wird Ihr Ergebnis Ihrer Eingabeaufforderung entsprechen.
Beispiele: