Waren Sie jemals verwirrt über die Bedeutung von Parametern wie CFG-Skala, Startwert oder negativer Prompt? Du bist an der richtigen Stelle. In diesem Handbuch geben wir Ihnen die umfassendste Erklärung der einzelnen Parameter anhand klarer Beispiele. Sie denken vielleicht, Sie wissen bereits alles, aber wir garantieren, dass Sie etwas Neues lernen werden. Lassen Sie uns loslegen und das volle Potenzial von Stable Diffusion mit diesen Parametern gemeinsam ausschöpfen.
Eine negative Aufforderung ist genau das, wonach sie sich anhört — sie ist das Gegenteil einer Aufforderung. Ihre Eingabe ist das, was Sie NICHT möchten, dass Stable Diffusion generiert wird. Dies ist eine sehr leistungsstarke, aber wenig genutzte Funktion von Stable Diffusion. Sie kann Ihnen dabei helfen, Ergebnisse zu erzielen, deren Erzielung viel mehr Zeit in Anspruch nehmen würde, wenn Sie nur die positive Aufforderung anpassen.
Wir wissen, dass es schwierig sein kann, negative Aufforderungen zu finden, daher haben wir negative Aufforderungen für https://openart.ai/create Damit Sie leicht auswählen können, finden Sie hier einige Beispiele, um ihre Wirkung zu demonstrieren.
Allgemeine negative Aufforderungen: Allgemein: Niedrige Auflösung, Fehler, beschnitten, schlechteste Qualität, niedrige Qualität, JPEG-Artefakte, außerhalb des Rahmens, Wasserzeichen, Signatur
Negative Aufforderungen für Personenporträts: deformiert, hässlich, verstümmelt, entstellt, Text, zusätzliche Gliedmaßen, Gesicht geschnitten, Kopf geschnitten, zusätzliche Finger, zusätzliche Arme, schlecht gezeichnetes Gesicht, Mutation, schlechte Proportionen, abgeschnittener Kopf, missgebildete Gliedmaßen, mutierte Hände, verschmolzene Finger, langer Hals
Negative Aufforderungen für fotorealistische Bilder: Fotorealistisch: Illustration, Malerei, Zeichnung, Kunst, Skizze
Stable Diffusion erzeugt ein Bild, indem es mit einer Leinwand voller Rauschen beginnt und diese schrittweise entrauscht, bis die endgültige Ausgabe erreicht ist. Dieser Parameter steuert die Anzahl dieser Schritte zur Rauschunterdrückung. Normalerweise ist höher besser, aber bis zu einem gewissen Grad. Die Standardeinstellung, die wir verwenden, sind 25 Schritte, was ausreichen sollte, um jede Art von Bild zu generieren.
Hier ist eine allgemeine Anleitung, welche Schrittnummer für verschiedene Fälle verwendet werden sollte:
Manche Leute sind es gewohnt, Bilder mit 100 oder 150 Schritten zu erstellen, das war nützlich für Sampler wie LMS, aber jetzt wird es mit den verbesserten schnellen Samplern wie DDIM und DPM Solver++ im Allgemeinen nicht mehr benötigt, wenn Sie mit diesen Samplern eine hohe Anzahl von Schritten verwenden, verschwenden Sie wahrscheinlich Ihre Zeit und GPU-Leistung, ohne die Bildqualität zu verbessern.
Wie bereits erwähnt, funktionieren Diffusionsmodelle, indem sie eine anfängliche Geräuschkulisse entrauschen. An dieser Stelle kommen Diffusionssampler zum Einsatz. Einfach ausgedrückt handelt es sich bei diesen Samplern um Algorithmen, die das generierte Bild nach jedem Schritt mit dem vergleichen, was die Textaufforderung angefordert hat, und dann einige Änderungen an dem Rauschen vornehmen, bis nach und nach ein Bild erreicht wird, das der Textbeschreibung entspricht.
Auf OpenArt haben wir die drei von Benutzern am häufigsten verwendeten Sampler implementiert, Euler A, DDIM und DPM Solver++. Sie können die drei ausprobieren und herausfinden, was besser zu Ihrem Prompt passt, da es keine Regel gibt, welcher Sampler verwendet werden soll, aber diese drei sind sehr schnell und können kohärente Ergebnisse in 15-25 Schritten liefern.
Es gibt nur einen merklichen Unterschied zwischen Euler ein Sampler und die anderen beiden, die es wert sind, erwähnt zu werden, in diesem Vergleich seht ihr wie Euler ein Ergebnisse — verglichen mit DPM-Löser++— haben Sie glattere Farben mit weniger definierten Kanten, was dem Ganzen einen eher „verträumten“ Look verleiht, also verwenden Sie Euler ein wenn dies ein Effekt ist, den Sie in Ihren generierten Bildern bevorzugen.
Dieser Parameter kann als Skala „Kreativität vs. Prompt“ betrachtet werden. Niedrigere Zahlen geben der KI mehr Freiheit, kreativ zu sein, während höhere Zahlen sie zwingen, sich mehr an die Aufforderung zu halten.
Die auf OpenArt verwendete Standard-CFG ist 7, was die beste Balance zwischen Kreativität und der Generierung Ihrer Wünsche bietet. Ein Wert unter 5 wird im Allgemeinen nicht empfohlen, da die Bilder möglicherweise eher wie KI-Halluzinationen aussehen, und wenn Sie über 16 gehen, können Bilder mit hässlichen Artefakten entstehen
Wann sollten also unterschiedliche CFG-Skalenwerte verwendet werden? Die CFG-Skala kann in verschiedene Bereiche unterteilt werden, die jeweils für einen anderen Prompt-Typ und ein anderes Ziel geeignet sind
Der Startwert ist eine Zahl, die das anfängliche zufällige Rauschen bestimmt, über das wir zuvor gesprochen haben, und da das zufällige Rauschen das endgültige Bild bestimmt, Dies ist der Grund, warum Sie jedes Mal ein anderes Bild erhalten, wenn Sie auf StableDiffusion-Systemen wie OpenArt genau dieselbe Aufforderung ausführen, und warum Sie dasselbe generierte Bild erhalten, wenn Sie denselben Seed mehrmals mit derselben Eingabeaufforderung ausführen.
Da dieselbe Kombination aus Seed und Prompt jedes Mal dasselbe Bild ergibt, können wir diese Eigenschaft auf verschiedene Arten zu unserem Vorteil nutzen:
Die Img2img-Funktion funktioniert genauso wie txt2img. Der einzige Unterschied besteht darin, dass Sie ein Bild angeben, das als Ausgangspunkt verwendet werden soll, und nicht das durch die Startnummer erzeugte Rauschen.
Dem Bild, das Sie als Init-Image für img2img verwenden, wird Rauschen hinzugefügt, und dann wird der Diffusionsprozess gemäß der Aufforderung fortgesetzt. Die Menge des hinzugefügten Rauschens hängt vom Parameter „Stärke von img2img“ ab, der von 0 bis 1 reicht, wobei 0 überhaupt kein Rauschen hinzufügt und Sie genau das Bild erhalten, das Sie hinzugefügt haben, und 1 ersetzt das Bild vollständig durch Rauschen und verhält sich fast so, als ob Sie normales txt2img anstelle von img2img verwendet hätten.
Wie entscheidet man also, welche Stärke verwendet werden soll? Hier ist eine einfache Anleitung mit Beispielen:
Herzlichen Glückwunsch, dass Sie so weit gekommen sind! Sie haben jetzt ein umfassendes Verständnis aller Parameter der stabilen Diffusion. Wenn Sie mehr darüber erfahren möchten, wie Sie bessere Prompts schreiben können, schauen Sie sich unsere an Sofortiges Buchen. Probieren Sie es auf jeden Fall aus, einige KI-Bilder zu erstellen https://openart.ai/create.
Dieser Beitrag wurde von unserem Community-Mitglied verfasst Öffentliche Aufforderung, der auch der Schöpfer von http://publicprompts.art/.
Zusammenfassend lässt sich sagen, dass die Beherrschung stabiler Diffusionsparameter für Künstler, die die Grenzen der KI-gestützten Kreativität erweitern möchten, von entscheidender Bedeutung ist. Dieser Leitfaden soll Ihnen das Wissen vermitteln, um diese Parameter fein abzustimmen und Ihre künstlerische Vision mit den Fähigkeiten der KI zu verbinden. Denken Sie daran, dass Experimentieren Ihr bestes Werkzeug ist. Jede Anpassung der Parameter ist der Perfektionierung Ihrer Kunst einen Schritt näher gekommen. Behalten Sie diesen Leitfaden als Referenz, während Sie weiter forschen und kreativ werden, und vergessen Sie nicht melden Sie sich an bei Open Art für mehr Einblicke, Tools und eine Community von gleichgesinnten Kreativen. Egal, ob Sie gerade erst anfangen oder Ihre Fähigkeiten verfeinern möchten, die Entdeckungs- und Kreationsreise ist endlos.