CFG 스케일, 시드 또는 네거티브 프롬프트와 같은 매개변수의 의미에 대해 혼란을 느낀 적이 있습니까? 잘 찾아오셨습니다.이 가이드에서는 명확한 예제와 함께 각 파라미터에 대한 가장 완전한 설명을 제공합니다.이미 모든 것을 알고 있다고 생각할 수도 있지만, 분명 새로운 것을 배울 수 있을 것입니다.이제 시작해서 이 파라미터들을 함께 사용하여 스테이블 디퓨전의 잠재력을 최대한 활용해봅시다.
네거티브 프롬프트는 말 그대로 프롬프트와 반대입니다.사용자가 입력한 내용은 스테이블 디퓨전이 생성하기를 원하지 않는 내용입니다. 이것은 Stable Diffusion의 매우 강력하지만 잘 사용되지 않는 기능이며, 긍정적인 프롬프트를 조정하기만 하면 도달하는 데 훨씬 더 많은 시간이 걸릴 결과를 달성하는 데 도움이 될 수 있습니다.
부정적인 프롬프트를 생각해내는 것이 어려울 수 있다는 것을 알고 있기 때문에 부정적인 프롬프트를 미리 큐레이션했습니다. https://openart.ai/create 쉽게 선택할 수 있도록 그 효과를 보여주는 몇 가지 예가 있습니다.
일반적인 부정적인 프롬프트: 일반: 저해상도, 오류, 잘림, 최악 품질, 저품질, jpeg 아티팩트, 프레임 아웃, 워터마크, 시그니처
인물 사진 촬영에 대한 부정적인 영향: 기형, 못생긴 것, 훼손된 것, 변형된 것, 글씨, 여분 팔다리, 얼굴을 잘랐을 때, 머리를 자른 모습, 손가락 여분, 팔 여분, 형편없는 얼굴, 돌연변이, 비율이 잘못된 경우, 잘린 머리, 기형 팔다리, 돌연변이 손, 융기된 손가락, 긴 목
포토리얼리스틱 이미지를 위한 네거티브 프롬프트: 포토리얼리스틱: 일러스트레이션, 페인팅, 드로잉, 아트, 스케치'
Stable Diffusion은 노이즈가 가득한 캔버스에서 시작하여 최종 출력에 도달하기 위해 점진적으로 노이즈를 제거하여 이미지를 만듭니다.이 파라미터는 이러한 노이즈 제거 단계의 수를 제어합니다. 일반적으로 높을수록 좋지만 어느 정도까지는 그렇습니다.우리가 사용하는 기본값은 25단계로 모든 종류의 이미지를 생성하기에 충분합니다..
다음은 다양한 경우에 사용할 단계 번호에 대한 일반적인 가이드입니다.
어떤 사람들은 100 또는 150 단계로 이미지를 만드는 데 익숙합니다. 이것은 LMS와 같은 샘플러에 유용했습니다. 하지만 이제는 일반적으로 DDIM 및 DPM Solver++와 같은 개선된 고속 샘플러에서는 더 이상 필요하지 않습니다., 이러한 샘플러에 많은 단계를 사용하면 이미지 품질을 향상시키지 않고도 시간과 GPU 성능을 낭비하게 될 것입니다.
앞서 언급했듯이 Diffusion 모델은 시작 노이즈 캔버스의 노이즈를 제거하는 방식으로 작동합니다.바로 이 부분에서 디퓨전 샘플러가 작동합니다.간단히 말해서 이러한 샘플러는 각 단계 후에 생성된 이미지를 가져와 텍스트 프롬프트가 요청한 것과 비교한 다음, 텍스트 설명과 일치하는 이미지가 점차 나올 때까지 노이즈에 몇 가지 변경 사항을 추가하는 알고리즘입니다.
OpenArt에서는 사용자가 가장 많이 사용하는 세 가지 샘플러인 오일러 A, DDIM 및 DPM 솔버++를 구현했습니다. 어떤 샘플러를 사용해야 하는지에 대한 규칙이 없기 때문에 세 가지를 사용해 보고 프롬프트에 더 잘 맞는 것이 무엇인지 확인할 수 있습니다. 하지만 이 세 가지 샘플은 매우 빠르고 15-25단계로 일관된 결과를 생성할 수 있습니다.
눈에 띄는 차이점은 하나뿐입니다. 오일러 a 샘플러와 언급할만한 다른 두 가지가 있습니다. 이 비교에서 그 방법을 알 수 있습니다. 오일러 a 결과 — 비교 DPM 솔버++— 색상이 더 매끄럽고 가장자리가 덜 선명하여 “몽환적인” 느낌을 주므로 사용하십시오. 오일러 a 생성된 이미지에서 이 효과를 선호하는 경우
이 매개변수는 “창의성 대 즉흥” 척도로 볼 수 있습니다.숫자가 작을수록 AI가 더 자유롭게 창의력을 발휘할 수 있는 반면, 숫자가 높을수록 프롬프트에 더 집중하게 됩니다.
OpenArt에서 사용되는 기본 CFG는 7이며, 이는 창의성과 원하는 것을 생성하는 것 사이에서 최상의 균형을 제공합니다. 일반적으로 5보다 낮게 설정하는 것은 권장되지 않습니다. 이미지가 AI 환각처럼 보이기 시작할 수 있고, 16을 초과하면 이미지가 보기 흉한 아티팩트가 나타날 수 있기 때문입니다.
그렇다면 언제 다른 CFG 스케일 값을 사용해야 할까요?CFG 척도는 각기 다른 프롬프트 유형 및 목표에 적합한 여러 범위로 나눌 수 있습니다.
시드란 앞서 이야기한 초기의 랜덤 노이즈를 결정하는 숫자이고, 랜덤 노이즈가 최종 이미지를 결정하는 것이기 때문에 OpenArt와 같은 StableDiffusion 시스템에서 똑같은 프롬프트를 실행할 때마다 다른 이미지가 표시되는 이유이며, 동일한 프롬프트로 동일한 시드를 여러 번 실행하면 동일한 이미지가 생성되는 이유입니다.
동일한 시드와 프롬프트 콤보가 매번 동일한 이미지를 제공하므로 이 속성을 여러 가지 방법으로 유용하게 사용할 수 있습니다.
Img2img 기능은 txt2img와 똑같은 방식으로 작동하지만, 유일한 차이점은 시드 번호에서 생성되는 노이즈 대신 시작점으로 사용할 이미지를 제공한다는 것입니다.
img2img의 초기화 이미지로 사용하는 이미지에 노이즈가 추가된 다음 프롬프트에 따라 확산 프로세스가 계속됩니다. 추가되는 노이즈의 양은 “img2img의 강도” 매개변수에 따라 달라집니다. 이 매개변수의 범위는 0에서 1까지입니다. 여기서 0이면 노이즈가 전혀 추가되지 않아 추가한 정확한 이미지를 얻을 수 있고 1은 이미지를 노이즈로 완전히 대체하며 img2img 대신 일반 txt2img를 사용한 것처럼 작동합니다.
그렇다면 어떤 힘을 사용할지 결정하는 방법은 무엇입니까?다음은 예제가 포함된 간단한 안내서입니다.
여기까지 오게 된 것을 축하합니다!이제 모든 스테이블 디퓨전 파라미터를 포괄적으로 이해하셨을 것입니다.더 나은 프롬프트를 작성하는 방법에 대해 자세히 알아보려면 여기를 참조하세요. 프롬프트 북.AI 이미지를 만들어 보는 것도 한 번 시도해 보세요. https://openart.ai/create.
이 게시물은 커뮤니티 회원이 기고했습니다. 공개 프롬프트, 의 제작자이기도 한 http://publicprompts.art/.
결론적으로, AI 기반 창의성의 한계를 넓히려는 아티스트에게는 안정적인 확산 파라미터를 마스터하는 것이 중요합니다.이 가이드는 예술적 시각과 AI 기능을 결합하여 이러한 파라미터를 세밀하게 조정할 수 있는 지식을 제공하는 것을 목표로 합니다.실험이 최고의 도구라는 점을 기억하세요.파라미터를 조정할 때마다 작품을 완성하는 데 한 걸음 더 다가갈 수 있습니다.계속 탐구하고 창작할 때 이 안내서를 참고 자료로 보관하고 잊지 마세요. 가입하기 Open Art에서 더 많은 인사이트, 도구, 같은 생각을 가진 크리에이티브 커뮤니티를 확인하세요.이제 막 시작했든 기술을 다듬고 싶든, 발견과 창조의 여정은 끝이 없습니다.