Podstawowe parametry Stable Diffusion

STABLE DIFFUSION

Stable Diffusion to zaawansowany model AI do generowania obrazów, który oferuje szereg parametrów kontrolujących proces tworzenia. Zrozumienie tych ustawień jest kluczowe dla osiągnięcia pożądanych rezultatów i pełnego wykorzystania możliwości technologii. Odpowiednia konfiguracja parametrów może drastycznie wpłynąć na jakość, styl i szczegółowość generowanych obrazów.

Metody Próbkowania (Samplers)

Samplary to algorytmy kontrolujące proces przekształcania szumu w obraz. Każda metoda oferuje inny balans między jakością a szybkością generowania. Euler i DPM++ 2M Karras są rekomendowane jako wszechstronne opcje dla większości zastosowań. DDIM (Denoising Diffusion Implicit Models) działa szybciej i zapewnia gładkie rezultaty przy mniejszej liczbie kroków, co czyni go idealnym do szybkiego prototypowania. Wybór samplera powinien zależeć od konkretnego przypadku użycia – niektóre zachowują więcej detali, inne oferują większą kreatywność.

SamplerTypZaletyWadyTypowe zastosowania
EulerDeterministycznySzybki, stabilny, dobre rezultaty przy niskiej liczbie krokówMoże tracić szczegóły przy wysokiej liczbie krokówOgólne generowanie, szybkie prototypowanie
Euler aAncestralnyBardziej kreatywne, różnorodne wynikiBrak powtarzalności, obrazy mogą się zmieniać przy różnych krokachEksperymenty, generowanie wariacji
DDIMDeterministycznySzybki, gładkie rezultaty przy małej liczbie krokówMniej szczegółów, mniej używany obecnieSzybkie szkice, podstawowe generowanie
PLMSDeterministycznyLepszy od DDIM, szybszy niż wiele innychJakość poniżej nowszych samplerówStarsze wersje Stable Diffusion
DPM++ 2MDeterministyczny (2. rzędu, Multi-step)Wysoka jakość, szybka konwergencja, stabilnośćMoże powodować deformacje przy wysokim CFGWysokiej jakości obrazy, uniwersalne zastosowania
DPM++ 2M KarrasDeterministyczny (Karras noise schedule)Bardzo szybka konwergencja, świetna jakość, nowoczesnyWolniejszy przy dużej liczbie krokówObrazy wymagające detali i stabilności
DPM++ SDEStochastycznyWysoka jakość, lepsze modelowanie szumuWolniejszy, nie zawsze konwergujeEksperymenty, generowanie wariacji
LMS KarrasDeterministyczny (Karras noise schedule)Stabilność, dobra jakośćWolniejszy, może mieć trudności z konwergencjąObrazy wymagające stabilności
HeunDeterministyczny (2. rzędu)Szybka konwergencja, dobre detaleWolniejszy niż Euler, wymaga mniej krokówObrazy wymagające precyzji
UniPCDeterministycznyNowoczesny, szybka konwergencjaNieco wolniejszy niż EulerUniwersalne zastosowania
  • Deterministyczne samplery (np. Euler, DPM++ 2M) zapewniają powtarzalność wyników i są preferowane do stabilnych, wysokiej jakości obrazów.
  • Ancestralne i stochastyczne samplery (np. Euler a, DPM++ SDE) dają większą różnorodność, ale mniej powtarzalności.
  • Karras noise schedule w samplerach poprawia jakość detali przy większej liczbie kroków.

Liczba Kroków Próbkowania (Steps)

Parametr ten określa liczbę iteracji przekształcania szumu w finalny obraz. Około 25 kroków zazwyczaj wystarcza do uzyskania wysokiej jakości rezultatu. Więcej kroków niekoniecznie oznacza lepszą jakość – po pewnym progu dodatkowe kroki mogą nawet pogorszyć obraz. Różne samplery wymagają różnej liczby kroków – niektóre osiągają dobrą jakość już przy 8 krokach, podczas gdy inne potrzebują nawet 40.

Skala CFG (Classifier-Free Guidance)

Skala CFG kontroluje, jak ściśle proces generowania podąża za tekstowym promptem. Wartości między 7 a 10 są zwykle optymalne dla większości zastosowań. Niskie wartości (1-3) dają modelowi więcej swobody twórczej, podczas gdy wysokie wartości (powyżej 12) mogą prowadzić do przesadnego nasycenia kolorów i utraty subtelności. Dla modeli o szybkim próbkowaniu, jak LCM i SDXL Turbo, zalecane są znacznie niższe wartości CFG (1-2).

Wymiary Obrazu

Stable Diffusion został zoptymalizowany dla rozmiaru 512×512 pikseli. Dla innych proporcji zaleca się: 768×512 dla krajobrazów i 512×768 dla portretów. Przekraczanie szerokości lub wysokości 768 pikseli może prowadzić do zniekształceń i artefaktów. Wybór odpowiednich wymiarów ma bezpośredni wpływ na jakość, szczegółowość i czas generowania.

Denoising Strength (dla img2img)

W trybie img2img, ten parametr kontroluje stopień modyfikacji oryginalnego obrazu. Wartości (od 0 do 1) określają balans między oryginalnym obrazem a nową generacją. Niskie wartości (0.25) zachowują więcej z oryginału, podczas gdy wysokie (0.75) mogą całkowicie przekształcić obraz. Nawet niewielka zmiana tego parametru może spowodować znaczącą różnicę w rezultacie.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry
Hej. Nie zapomnij podzielić się opinią oraz udostępnić dalej.