Vous êtes-vous déjà senti confus quant à la signification de paramètres tels que l'échelle CFG, la vitesse ou l'invite négative ? Vous êtes au bon endroit. Dans ce guide, nous vous donnerons l'explication la plus complète de chaque paramètre avec des exemples clairs. Vous pensez peut-être déjà tout savoir, mais nous vous garantissons que vous apprendrez quelque chose de nouveau. Commençons et exploitons tout le potentiel de la diffusion stable avec ces paramètres ensemble.
Une invite négative est exactement ce à quoi elle ressemble : c'est le contraire d'une invite. Votre entrée correspond à ce que vous NE VOULEZ PAS que Stable Diffusion génère. Il s'agit d'une fonctionnalité très puissante mais sous-utilisée de Stable Diffusion, qui peut vous aider à obtenir des résultats qui prendraient beaucoup plus de temps en modifiant simplement l'invite positive.
Nous savons qu'il peut être difficile de trouver des invites négatives, c'est pourquoi nous avons pré-organisé des invites négatives sur https://openart.ai/create pour que vous puissiez facilement choisir, voici quelques exemples pour démontrer leurs effets.
Indices négatives générales: Général : basse résolution, erreur, recadrage, qualité médiocre, artefacts JPEG, hors cadre, filigrane, signature
Invitations négatives pour les portraits de personnes: déformé, laid, mutilé, défiguré, texte, membres supplémentaires, visage coupé, tête coupée, doigts supplémentaires, bras supplémentaires, visage mal dessiné, mutation, mauvaises proportions, tête coupée, membres malformés, mains mutées, doigts fusionnés, cou long
Invitations négatives pour des images photoréalistes: Photoréaliste : illustration, peinture, dessin, art, croquis »
Stable Diffusion crée une image en commençant par une toile pleine de bruit et en la débruitant progressivement pour atteindre le résultat final. Ce paramètre contrôle le nombre de ces étapes de débruitage. Habituellement, plus c'est mieux, mais dans une certaine mesure. La valeur par défaut que nous utilisons est de 25 étapes, ce qui devrait suffire pour générer n'importe quel type d'image..
Voici un guide général sur le numéro d'étape à utiliser dans différents cas :
Certaines personnes ont l'habitude de créer des images en 100 ou 150 étapes, ce qui était utile pour les samplers tels que LMS, mais aujourd'hui, il n'est généralement plus nécessaire avec les échantillonneurs rapides améliorés tels que DDIM et DPM Solver++, en effectuant un grand nombre d'étapes avec ces échantillonneurs, vous perdrez probablement votre temps et votre puissance graphique, sans aucune amélioration de la qualité de l'image.
Comme nous l'avons mentionné précédemment, les modèles de diffusion fonctionnent en débruitant un canevas de bruit de départ. C'est là que les échantillonneurs de diffusion entrent en jeu. En termes simples, ces échantillonneurs sont des algorithmes qui prennent l'image générée après chaque étape et la comparent à ce que l'invite de texte a demandé, puis ajoutent quelques modifications au bruit jusqu'à ce qu'il atteigne progressivement une image correspondant à la description textuelle.
Sur OpenArt, nous avons implémenté les trois samplers les plus utilisés par les utilisateurs, Euler A, DDIM et DPM Solver++. Vous pouvez essayer les trois options et voir ce qui correspond le mieux à votre demande puisqu'il n'existe aucune règle quant au choix de l'échantillonneur à utiliser, mais ces trois méthodes sont très rapides et capables de produire des résultats cohérents en 15 à 25 étapes.
Il n'y a qu'une seule différence notable entre Euler A. sampler et les deux autres qui méritent d'être mentionnés, dans cette comparaison, vous pouvez voir comment Euler A. résultats — par rapport à Solveur DPM++— ont des couleurs plus lisses avec des bords moins définis, ce qui leur donne un aspect plus « rêveur », alors utilisez Euler A. s'il s'agit d'un effet que vous préférez dans vos images générées.
Ce paramètre peut être considéré comme l'échelle « Créativité par rapport à la rapidité ». Des chiffres plus faibles donnent à l'IA plus de liberté pour faire preuve de créativité, tandis que des chiffres plus élevés l'obligent à s'en tenir davantage à l'invite.
Le CFG par défaut utilisé sur OpenArt est 7, ce qui donne le meilleur équilibre entre créativité et génération de ce que vous voulez. Une valeur inférieure à 5 n'est généralement pas recommandée car les images peuvent commencer à ressembler davantage à des hallucinations de l'IA, et une valeur supérieure à 16 peut commencer à donner des images contenant de vilains artefacts
Alors, quand utiliser différentes valeurs d'échelle CFG ? L'échelle CFG peut être divisée en différentes plages, chacune adaptée à un type d'invite et à un objectif différents
La graine est un nombre qui détermine le bruit aléatoire initial dont nous avons parlé précédemment, et puisque c'est le bruit aléatoire qui détermine l'image finale, c'est la raison pour laquelle vous obtenez une image différente chaque fois que vous exécutez exactement la même invite sur les systèmes StableDiffusion tels qu'OpenArt, et pourquoi vous obtenez la même image générée si vous exécutez la même graine avec la même invite plusieurs fois.
Comme la même combinaison de départ et d'invite donne la même image à chaque fois, nous pouvons utiliser cette propriété à notre avantage de plusieurs manières :
La fonction Img2img fonctionne exactement de la même manière que txt2img, la seule différence est que vous fournissez une image à utiliser comme point de départ au lieu du bruit généré par le numéro de départ.
Du bruit est ajouté à l'image que vous utilisez comme image d'initialisation pour img2img, puis le processus de diffusion se poursuit conformément à l'invite. La quantité de bruit ajoutée dépend du paramètre « Strength of img2img », qui est compris entre 0 et 1, où 0 n'ajoute aucun bruit et vous obtiendrez l'image exacte que vous avez ajoutée, et 1 remplace complètement l'image par du bruit et agit presque comme si vous utilisiez un txt2img normal au lieu de img2img.
Alors, comment décider de la force à utiliser ? Voici un guide simple avec des exemples :
Félicitations pour avoir atteint ce stade ! Vous avez maintenant une compréhension complète de tous les paramètres de diffusion stable. Si vous souhaitez en savoir plus sur la façon de rédiger de meilleures instructions, vous pouvez consulter notre Livre rapide. Essayez-le certainement en créant des images AI sur https://openart.ai/create.
Cet article a été rédigé par un membre de notre communauté Invite publique, qui est également le créateur de http://publicprompts.art/.
En conclusion, la maîtrise de paramètres de diffusion stables est essentielle pour les artistes qui cherchent à repousser les limites de la créativité améliorée par l'IA. Ce guide vise à vous fournir les connaissances nécessaires pour affiner ces paramètres, en alliant votre vision artistique aux capacités de l'IA. N'oubliez pas que l'expérimentation est votre meilleur outil. Chaque ajustement des paramètres est un pas de plus vers le perfectionnement de votre art. Pendant que vous continuez à explorer et à créer, gardez ce guide comme référence et n'oubliez pas de inscrivez-vous à Open Art pour plus d'informations, d'outils et une communauté de créatifs partageant les mêmes idées. Que vous soyez débutant ou que vous cherchiez à perfectionner vos compétences, le voyage de découverte et de création est infini.