Le guide le plus complet sur les paramètres de diffusion stables

Vous êtes-vous déjà senti confus quant à la signification de paramètres tels que l'échelle CFG, la vitesse ou l'invite négative ? Vous êtes au bon endroit. Dans ce guide, nous vous donnerons l'explication la plus complète de chaque paramètre avec des exemples clairs. Vous pensez peut-être déjà tout savoir, mais nous vous garantissons que vous apprendrez quelque chose de nouveau. Commençons et exploitons tout le potentiel de la diffusion stable avec ces paramètres ensemble.

Prompt négatif

Une invite négative est exactement ce à quoi elle ressemble : c'est le contraire d'une invite. Votre entrée correspond à ce que vous NE VOULEZ PAS que Stable Diffusion génère. Il s'agit d'une fonctionnalité très puissante mais sous-utilisée de Stable Diffusion, qui peut vous aider à obtenir des résultats qui prendraient beaucoup plus de temps en modifiant simplement l'invite positive.

Nous savons qu'il peut être difficile de trouver des invites négatives, c'est pourquoi nous avons pré-organisé des invites négatives sur https://openart.ai/create pour que vous puissiez facilement choisir, voici quelques exemples pour démontrer leurs effets.

Indices négatives générales: Général : basse résolution, erreur, recadrage, qualité médiocre, artefacts JPEG, hors cadre, filigrane, signature

Invitations négatives pour les portraits de personnes: déformé, laid, mutilé, défiguré, texte, membres supplémentaires, visage coupé, tête coupée, doigts supplémentaires, bras supplémentaires, visage mal dessiné, mutation, mauvaises proportions, tête coupée, membres malformés, mains mutées, doigts fusionnés, cou long

Invitations négatives pour des images photoréalistes: Photoréaliste : illustration, peinture, dessin, art, croquis »

Étapes

Stable Diffusion crée une image en commençant par une toile pleine de bruit et en la débruitant progressivement pour atteindre le résultat final. Ce paramètre contrôle le nombre de ces étapes de débruitage. Habituellement, plus c'est mieux, mais dans une certaine mesure. La valeur par défaut que nous utilisons est de 25 étapes, ce qui devrait suffire pour générer n'importe quel type d'image..

Voici un guide général sur le numéro d'étape à utiliser dans différents cas :

  • Si vous testez une nouvelle invite et que vous souhaitez obtenir des résultats rapides pour modifier votre saisie, suivez 10 à 15 étapes
  • Lorsque vous trouvez l'invite qui vous convient, augmentez le nombre d'étapes à 25.
  • Si vous créez un visage ou un animal avec de la fourrure ou tout autre sujet dont la texture est détaillée, et que vous pensez que certains détails manquent aux images générées, essayez de le porter à 40 !
La même invite avec un nombre d'étapes différent

Certaines personnes ont l'habitude de créer des images en 100 ou 150 étapes, ce qui était utile pour les samplers tels que LMS, mais aujourd'hui, il n'est généralement plus nécessaire avec les échantillonneurs rapides améliorés tels que DDIM et DPM Solver++, en effectuant un grand nombre d'étapes avec ces échantillonneurs, vous perdrez probablement votre temps et votre puissance graphique, sans aucune amélioration de la qualité de l'image.

Échantillonneurs

Comme nous l'avons mentionné précédemment, les modèles de diffusion fonctionnent en débruitant un canevas de bruit de départ. C'est là que les échantillonneurs de diffusion entrent en jeu. En termes simples, ces échantillonneurs sont des algorithmes qui prennent l'image générée après chaque étape et la comparent à ce que l'invite de texte a demandé, puis ajoutent quelques modifications au bruit jusqu'à ce qu'il atteigne progressivement une image correspondant à la description textuelle.

Sur OpenArt, nous avons implémenté les trois samplers les plus utilisés par les utilisateurs, Euler A, DDIM et DPM Solver++. Vous pouvez essayer les trois options et voir ce qui correspond le mieux à votre demande puisqu'il n'existe aucune règle quant au choix de l'échantillonneur à utiliser, mais ces trois méthodes sont très rapides et capables de produire des résultats cohérents en 15 à 25 étapes.

Il n'y a qu'une seule différence notable entre Euler A. sampler et les deux autres qui méritent d'être mentionnés, dans cette comparaison, vous pouvez voir comment Euler A. résultats — par rapport à Solveur DPM++— ont des couleurs plus lisses avec des bords moins définis, ce qui leur donne un aspect plus « rêveur », alors utilisez Euler A. s'il s'agit d'un effet que vous préférez dans vos images générées.

Échelle de guidage CFG

Ce paramètre peut être considéré comme l'échelle « Créativité par rapport à la rapidité ». Des chiffres plus faibles donnent à l'IA plus de liberté pour faire preuve de créativité, tandis que des chiffres plus élevés l'obligent à s'en tenir davantage à l'invite.

Le CFG par défaut utilisé sur OpenArt est 7, ce qui donne le meilleur équilibre entre créativité et génération de ce que vous voulez. Une valeur inférieure à 5 n'est généralement pas recommandée car les images peuvent commencer à ressembler davantage à des hallucinations de l'IA, et une valeur supérieure à 16 peut commencer à donner des images contenant de vilains artefacts

Alors, quand utiliser différentes valeurs d'échelle CFG ? L'échelle CFG peut être divisée en différentes plages, chacune adaptée à un type d'invite et à un objectif différents

  • CFG 2 À 6: C'est créatif, mais il est peut-être trop déformé et ne suivez pas les instructions. Peut être amusant et utile pour les courtes instructions
  • CFG 7 ET 10: Recommandé pour la plupart des instructions. Bon équilibre entre créativité et génération guidée
  • CFG 10 ET 15: lorsque vous êtes sûr que votre invite est détaillée et très claire quant à l'apparence que vous souhaitez donner à l'image
  • CFG 16 ET 20: Déconseillé en général à moins que l'invite ne soit bien détaillée. Peut affecter la cohérence et la qualité
  • CFG > 20: presque jamais utilisable

Graine

La graine est un nombre qui détermine le bruit aléatoire initial dont nous avons parlé précédemment, et puisque c'est le bruit aléatoire qui détermine l'image finale, c'est la raison pour laquelle vous obtenez une image différente chaque fois que vous exécutez exactement la même invite sur les systèmes StableDiffusion tels qu'OpenArt, et pourquoi vous obtenez la même image générée si vous exécutez la même graine avec la même invite plusieurs fois.

Comme la même combinaison de départ et d'invite donne la même image à chaque fois, nous pouvons utiliser cette propriété à notre avantage de plusieurs manières :

  • Contrôlez les caractéristiques spécifiques d'un personnage: dans cet exemple, nous avons modifié l'émotion, mais cela peut également fonctionner pour d'autres caractéristiques physiques telles que la couleur des cheveux ou la couleur de la peau, mais plus le changement est faible, plus il a de chances de fonctionner
  • Tester l'effet de mots spécifiques: Si vous vous demandez ce qu'un mot spécifique est en train de changer dans l'invite, vous pouvez utiliser la même graine avec une invite modifiée pour le tester. Il est recommandé de tester les invites de cette façon en changeant un seul mot ou une seule phrase à chaque fois
  • Changer de style: Si vous aimez la composition d'une image, mais que vous vous demandez à quoi elle ressemblerait dans un style différent, vous pouvez l'utiliser pour les portraits, les paysages ou toute autre scène que vous créez.

Paramètres Img2Img

La fonction Img2img fonctionne exactement de la même manière que txt2img, la seule différence est que vous fournissez une image à utiliser comme point de départ au lieu du bruit généré par le numéro de départ.

Du bruit est ajouté à l'image que vous utilisez comme image d'initialisation pour img2img, puis le processus de diffusion se poursuit conformément à l'invite. La quantité de bruit ajoutée dépend du paramètre « Strength of img2img », qui est compris entre 0 et 1, où 0 n'ajoute aucun bruit et vous obtiendrez l'image exacte que vous avez ajoutée, et 1 remplace complètement l'image par du bruit et agit presque comme si vous utilisiez un txt2img normal au lieu de img2img.

Alors, comment décider de la force à utiliser ? Voici un guide simple avec des exemples :

  • Pour créer des variantes d'une image, l'intensité suggérée à utiliser serait de 0,5 à 0,75 et avec la même invite. Cela peut être utile lorsque vous aimez la composition d'une image créée mais que certains détails ne sont pas assez beaux, ou si vous souhaitez créer des images similaires à des images créées dans d'autres logiciels tels que Blender ou Photoshop (dans ce cas, l'invite serait une description de l'image).
  • Pour modifier le style d'une image tout en restant similaire à l'original, vous pouvez utiliser plusieurs fois un img2img de faible intensité et obtenir une bien meilleure fidélité d'image par rapport à un seul img2img plus puissant. Pour cet exemple, nous avons utilisé 4 fois une intensité de 0,25. Ainsi, chaque fois que nous générons l'image, nous réinsérons l'image générée dans le fichier img2img et la réexécutons avec la même invite et la même intensité jusqu'à obtenir le style dont nous avons besoin. Si la même image était utilisée dans img2img avec une intensité plus élevée, vous perdriez rapidement la ressemblance de l'image.

Félicitations pour avoir atteint ce stade ! Vous avez maintenant une compréhension complète de tous les paramètres de diffusion stable. Si vous souhaitez en savoir plus sur la façon de rédiger de meilleures instructions, vous pouvez consulter notre Livre rapide. Essayez-le certainement en créant des images AI sur https://openart.ai/create.

Cet article a été rédigé par un membre de notre communauté Invite publique, qui est également le créateur de http://publicprompts.art/.

Commencez à créer sur OpenArt !

En conclusion, la maîtrise de paramètres de diffusion stables est essentielle pour les artistes qui cherchent à repousser les limites de la créativité améliorée par l'IA. Ce guide vise à vous fournir les connaissances nécessaires pour affiner ces paramètres, en alliant votre vision artistique aux capacités de l'IA. N'oubliez pas que l'expérimentation est votre meilleur outil. Chaque ajustement des paramètres est un pas de plus vers le perfectionnement de votre art. Pendant que vous continuez à explorer et à créer, gardez ce guide comme référence et n'oubliez pas de inscrivez-vous à Open Art pour plus d'informations, d'outils et une communauté de créatifs partageant les mêmes idées. Que vous soyez débutant ou que vous cherchiez à perfectionner vos compétences, le voyage de découverte et de création est infini.

Créez gratuitement
Commencez votre voyage créatif dès aujourd'hui