Heb je je ooit verward gevoeld over de betekenis van parameters zoals CFG-schaal, seed of negatieve prompt? Je bent bij ons aan het juiste adres. In deze handleiding geven we je de meest complete uitleg van elke parameter met duidelijke voorbeelden. Je denkt misschien dat je alles al weet, maar we garanderen dat je iets nieuws zult leren. Laten we aan de slag gaan en het volledige potentieel van Stable Diffusion benutten met deze parameters samen.
Een negatieve prompt is precies hoe het klinkt — het is het tegenovergestelde van een prompt. Je input is wat je NIET wilt dat Stable Diffusion genereert. Dit is een zeer krachtige maar onderbenutte functie van Stable Diffusion, en het kan u helpen om resultaten te bereiken die veel meer tijd in beslag zouden nemen door gewoon de positieve prompt aan te passen.
We weten dat het moeilijk kan zijn om met negatieve aanwijzingen op de proppen te komen, dus hebben we vooraf negatieve aanwijzingen samengesteld over https://openart.ai/create om gemakkelijk uit te kiezen, zijn hier enkele voorbeelden om hun effecten aan te tonen.
Algemene negatieve aanwijzingen: Algemeen: lage resolutie, fout, bijgesneden, slechtste kwaliteit, lage kwaliteit, jpeg-artefacten, buiten beeld, watermerk, handtekening
Negatieve aanwijzingen voor portretten van mensen: misvormd, lelijk, verminkt, misvormd, tekst, extra ledematen, gezichtssnede, hoofdsnee, extra vingers, extra armen, slecht getekend gezicht, mutatie, slechte proporties, bijgesneden hoofd, misvormde ledematen, gemuteerde handen, versmolten vingers, lange nek
Negatieve aanwijzingen voor fotorealistische afbeeldingen: Fotorealistisch: illustratie, schilderij, tekening, kunst, schets'
Stable Diffusion creëert een beeld door te beginnen met een canvas vol ruis en dit geleidelijk te verdoezelen om de uiteindelijke output te bereiken. Deze parameter bepaalt het aantal van deze ruisonderdrukkingsstappen. Meestal is hoger beter, maar tot op zekere hoogte. De standaardinstelling die we gebruiken is 25 stappen, wat voldoende zou moeten zijn om elk soort afbeelding te genereren.
Hier is een algemene handleiding over welk stappennummer u in verschillende gevallen moet gebruiken:
Sommige mensen zijn gewend om afbeeldingen te maken met 100 of 150 stappen, dit was handig voor samplers zoals LMS, maar nu is het over het algemeen niet meer nodig met de verbeterde snelle samplers zoals DDIM en DPM Solver++, door een groot aantal stappen uit te voeren met deze samplers verspilt u waarschijnlijk uw tijd en GPU-kracht, zonder dat de beeldkwaliteit toeneemt.
Zoals we eerder vermeldden, werken Diffusion-modellen door een canvas met startruis te dempen. Dit is waar Diffusion samplers aan het werk komen. Eenvoudig gezegd zijn deze samplers algoritmen die de gegenereerde afbeelding na elke stap vergelijken met wat in de tekstprompt werd gevraagd, en vervolgens een paar wijzigingen in de ruis aanbrengen totdat deze geleidelijk een afbeelding bereikt die overeenkomt met de tekstbeschrijving.
Op OpenArt hebben we de drie meest gebruikte samplers van gebruikers geïmplementeerd, Euler A, DDIM en DPM Solver++. U kunt de drie proberen en kijken wat beter bij uw prompt past, aangezien er geen regel is over welke sampler u moet gebruiken, maar deze drie zijn erg snel en kunnen coherente resultaten opleveren in stappen van 15-25.
Er is maar één merkbaar verschil tussen Euler a sampler en de andere twee die het vermelden waard zijn, in deze vergelijking kun je zien hoe Euler a resultaten — vergeleken met DPM Solver++— vloeiendere kleuren hebben met minder gedefinieerde randen, waardoor het er meer „dromerig” uitziet, dus gebruik Euler a als dit een effect is dat u verkiest in uw gegenereerde afbeeldingen.
Deze parameter kan worden gezien als de schaal „Creativiteit versus prompt”. Lagere cijfers geven de AI meer vrijheid om creatief te zijn, terwijl hogere cijfers ervoor zorgen dat ze zich meer aan de prompt houdt.
De standaard CFG die wordt gebruikt op OpenArt is 7, wat de beste balans biedt tussen creativiteit en het genereren van wat je wilt. Het wordt over het algemeen niet aanbevolen om lager dan 5 te gaan, omdat de afbeeldingen meer op AI-hallucinaties gaan lijken, en als ze boven de 16 komen, kunnen er beelden ontstaan met lelijke artefacten
Dus wanneer moet je verschillende CFG-schaalwaarden gebruiken? De CFG-schaal kan worden onderverdeeld in verschillende bereiken, elk geschikt voor een ander prompttype en doel
De seed is een getal dat de initiële willekeurige ruis heeft bepaald waar we het eerder over hadden, en aangezien de willekeurige ruis het uiteindelijke beeld bepaalt, het is de reden dat je elke keer dat je exact dezelfde prompt uitvoert een andere afbeelding krijgt op StableDiffusion-systemen zoals OpenArt, en waarom je dezelfde gegenereerde afbeelding krijgt als je dezelfde seed meerdere keren met dezelfde prompt uitvoert.
Aangezien dezelfde combinatie van seed en prompt elke keer dezelfde afbeelding geeft, kunnen we deze eigenschap op meerdere manieren in ons voordeel gebruiken:
De Img2IMG-functie werkt op exact dezelfde manier als txt2img, het enige verschil is dat u een afbeelding opgeeft die als startpunt kan worden gebruikt in plaats van de ruis die wordt gegenereerd door het seed-nummer.
Ruis wordt toegevoegd aan de afbeelding die u gebruikt als init-afbeelding voor img2img, en vervolgens wordt het diffusieproces volgens de prompt voortgezet. De hoeveelheid toegevoegde ruis is afhankelijk van de parameter „Strength of img2img”, die varieert van 0 tot 1, waarbij 0 helemaal geen ruis toevoegt en u de exacte afbeelding krijgt die u hebt toegevoegd, en 1 de afbeelding volledig vervangt door ruis en bijna doet alsof u normale txt2img hebt gebruikt in plaats van img2img.
Dus hoe bepaal je welke sterkte je moet gebruiken? Hier is een eenvoudige handleiding met voorbeelden:
Proficiat dat je zo ver bent gekomen! U hebt nu een volledig begrip van alle Stable Diffusion-parameters. Als je meer wilt weten over hoe je betere prompts kunt schrijven, kun je onze Snel boek. Probeer het zeker eens uit om wat AI-afbeeldingen te maken op https://openart.ai/create.
Dit bericht is bijgedragen door ons communitylid Publieke prompt, die ook de maker is van http://publicprompts.art/.
Kortom, het beheersen van stabiele diffusieparameters is essentieel voor kunstenaars die de grenzen van AI-verbeterde creativiteit willen verleggen. Deze gids is bedoeld om u de kennis bij te brengen om deze parameters nauwkeurig af te stemmen, waarbij uw artistieke visie wordt gecombineerd met de mogelijkheden van AI. Onthoud dat experimenteren je beste hulpmiddel is. Elke aanpassing aan de parameters is een stap dichter bij het perfectioneren van je kunst. Als je doorgaat met ontdekken en creëren, bewaar dan deze gids als referentie en vergeet niet om meld je aan bij Open Art voor meer inzichten, tools en een community van gelijkgestemde creatievelingen. Of je nu net begint of je vaardigheden wilt verfijnen, de reis van ontdekking en creatie is eindeloos.