Stable Diffusion to zaawansowany model AI do generowania obrazów, który oferuje szereg parametrów kontrolujących proces tworzenia. Zrozumienie tych ustawień jest kluczowe dla osiągnięcia pożądanych rezultatów i pełnego wykorzystania możliwości technologii. Odpowiednia konfiguracja parametrów może drastycznie wpłynąć na jakość, styl i szczegółowość generowanych obrazów.
Metody Próbkowania (Samplers)
Samplary to algorytmy kontrolujące proces przekształcania szumu w obraz. Każda metoda oferuje inny balans między jakością a szybkością generowania. Euler i DPM++ 2M Karras są rekomendowane jako wszechstronne opcje dla większości zastosowań. DDIM (Denoising Diffusion Implicit Models) działa szybciej i zapewnia gładkie rezultaty przy mniejszej liczbie kroków, co czyni go idealnym do szybkiego prototypowania. Wybór samplera powinien zależeć od konkretnego przypadku użycia – niektóre zachowują więcej detali, inne oferują większą kreatywność.
| Sampler | Typ | Zalety | Wady | Typowe zastosowania |
|---|---|---|---|---|
| Euler | Deterministyczny | Szybki, stabilny, dobre rezultaty przy niskiej liczbie kroków | Może tracić szczegóły przy wysokiej liczbie kroków | Ogólne generowanie, szybkie prototypowanie |
| Euler a | Ancestralny | Bardziej kreatywne, różnorodne wyniki | Brak powtarzalności, obrazy mogą się zmieniać przy różnych krokach | Eksperymenty, generowanie wariacji |
| DDIM | Deterministyczny | Szybki, gładkie rezultaty przy małej liczbie kroków | Mniej szczegółów, mniej używany obecnie | Szybkie szkice, podstawowe generowanie |
| PLMS | Deterministyczny | Lepszy od DDIM, szybszy niż wiele innych | Jakość poniżej nowszych samplerów | Starsze wersje Stable Diffusion |
| DPM++ 2M | Deterministyczny (2. rzędu, Multi-step) | Wysoka jakość, szybka konwergencja, stabilność | Może powodować deformacje przy wysokim CFG | Wysokiej jakości obrazy, uniwersalne zastosowania |
| DPM++ 2M Karras | Deterministyczny (Karras noise schedule) | Bardzo szybka konwergencja, świetna jakość, nowoczesny | Wolniejszy przy dużej liczbie kroków | Obrazy wymagające detali i stabilności |
| DPM++ SDE | Stochastyczny | Wysoka jakość, lepsze modelowanie szumu | Wolniejszy, nie zawsze konwerguje | Eksperymenty, generowanie wariacji |
| LMS Karras | Deterministyczny (Karras noise schedule) | Stabilność, dobra jakość | Wolniejszy, może mieć trudności z konwergencją | Obrazy wymagające stabilności |
| Heun | Deterministyczny (2. rzędu) | Szybka konwergencja, dobre detale | Wolniejszy niż Euler, wymaga mniej kroków | Obrazy wymagające precyzji |
| UniPC | Deterministyczny | Nowoczesny, szybka konwergencja | Nieco wolniejszy niż Euler | Uniwersalne zastosowania |
- Deterministyczne samplery (np. Euler, DPM++ 2M) zapewniają powtarzalność wyników i są preferowane do stabilnych, wysokiej jakości obrazów.
- Ancestralne i stochastyczne samplery (np. Euler a, DPM++ SDE) dają większą różnorodność, ale mniej powtarzalności.
- Karras noise schedule w samplerach poprawia jakość detali przy większej liczbie kroków.

Liczba Kroków Próbkowania (Steps)
Parametr ten określa liczbę iteracji przekształcania szumu w finalny obraz. Około 25 kroków zazwyczaj wystarcza do uzyskania wysokiej jakości rezultatu. Więcej kroków niekoniecznie oznacza lepszą jakość – po pewnym progu dodatkowe kroki mogą nawet pogorszyć obraz. Różne samplery wymagają różnej liczby kroków – niektóre osiągają dobrą jakość już przy 8 krokach, podczas gdy inne potrzebują nawet 40.
Skala CFG (Classifier-Free Guidance)
Skala CFG kontroluje, jak ściśle proces generowania podąża za tekstowym promptem. Wartości między 7 a 10 są zwykle optymalne dla większości zastosowań. Niskie wartości (1-3) dają modelowi więcej swobody twórczej, podczas gdy wysokie wartości (powyżej 12) mogą prowadzić do przesadnego nasycenia kolorów i utraty subtelności. Dla modeli o szybkim próbkowaniu, jak LCM i SDXL Turbo, zalecane są znacznie niższe wartości CFG (1-2).
Wymiary Obrazu
Stable Diffusion został zoptymalizowany dla rozmiaru 512×512 pikseli. Dla innych proporcji zaleca się: 768×512 dla krajobrazów i 512×768 dla portretów. Przekraczanie szerokości lub wysokości 768 pikseli może prowadzić do zniekształceń i artefaktów. Wybór odpowiednich wymiarów ma bezpośredni wpływ na jakość, szczegółowość i czas generowania.
Denoising Strength (dla img2img)
W trybie img2img, ten parametr kontroluje stopień modyfikacji oryginalnego obrazu. Wartości (od 0 do 1) określają balans między oryginalnym obrazem a nową generacją. Niskie wartości (0.25) zachowują więcej z oryginału, podczas gdy wysokie (0.75) mogą całkowicie przekształcić obraz. Nawet niewielka zmiana tego parametru może spowodować znaczącą różnicę w rezultacie.





