Podstawowe parametry Stable Diffusion

Stable Diffusion to zaawansowany model AI do generowania obrazów, który oferuje szereg parametrów kontrolujących proces tworzenia. Zrozumienie tych ustawień jest kluczowe dla osiągnięcia pożądanych rezultatów i pełnego wykorzystania możliwości technologii. Odpowiednia konfiguracja parametrów może drastycznie wpłynąć na jakość, styl i szczegółowość generowanych obrazów.

Metody Próbkowania (Samplers)

Samplary to algorytmy kontrolujące proces przekształcania szumu w obraz. Każda metoda oferuje inny balans między jakością a szybkością generowania. Euler i DPM++ 2M Karras są rekomendowane jako wszechstronne opcje dla większości zastosowań. DDIM (Denoising Diffusion Implicit Models) działa szybciej i zapewnia gładkie rezultaty przy mniejszej liczbie kroków, co czyni go idealnym do szybkiego prototypowania. Wybór samplera powinien zależeć od konkretnego przypadku użycia – niektóre zachowują więcej detali, inne oferują większą kreatywność.

Sampler	Typ	Zalety	Wady	Typowe zastosowania
Euler	Deterministyczny	Szybki, stabilny, dobre rezultaty przy niskiej liczbie kroków	Może tracić szczegóły przy wysokiej liczbie kroków	Ogólne generowanie, szybkie prototypowanie
Euler a	Ancestralny	Bardziej kreatywne, różnorodne wyniki	Brak powtarzalności, obrazy mogą się zmieniać przy różnych krokach	Eksperymenty, generowanie wariacji
DDIM	Deterministyczny	Szybki, gładkie rezultaty przy małej liczbie kroków	Mniej szczegółów, mniej używany obecnie	Szybkie szkice, podstawowe generowanie
PLMS	Deterministyczny	Lepszy od DDIM, szybszy niż wiele innych	Jakość poniżej nowszych samplerów	Starsze wersje Stable Diffusion
DPM++ 2M	Deterministyczny (2. rzędu, Multi-step)	Wysoka jakość, szybka konwergencja, stabilność	Może powodować deformacje przy wysokim CFG	Wysokiej jakości obrazy, uniwersalne zastosowania
DPM++ 2M Karras	Deterministyczny (Karras noise schedule)	Bardzo szybka konwergencja, świetna jakość, nowoczesny	Wolniejszy przy dużej liczbie kroków	Obrazy wymagające detali i stabilności
DPM++ SDE	Stochastyczny	Wysoka jakość, lepsze modelowanie szumu	Wolniejszy, nie zawsze konwerguje	Eksperymenty, generowanie wariacji
LMS Karras	Deterministyczny (Karras noise schedule)	Stabilność, dobra jakość	Wolniejszy, może mieć trudności z konwergencją	Obrazy wymagające stabilności
Heun	Deterministyczny (2. rzędu)	Szybka konwergencja, dobre detale	Wolniejszy niż Euler, wymaga mniej kroków	Obrazy wymagające precyzji
UniPC	Deterministyczny	Nowoczesny, szybka konwergencja	Nieco wolniejszy niż Euler	Uniwersalne zastosowania

Deterministyczne samplery (np. Euler, DPM++ 2M) zapewniają powtarzalność wyników i są preferowane do stabilnych, wysokiej jakości obrazów.
Ancestralne i stochastyczne samplery (np. Euler a, DPM++ SDE) dają większą różnorodność, ale mniej powtarzalności.
Karras noise schedule w samplerach poprawia jakość detali przy większej liczbie kroków.

Liczba Kroków Próbkowania (Steps)

Parametr ten określa liczbę iteracji przekształcania szumu w finalny obraz. Około 25 kroków zazwyczaj wystarcza do uzyskania wysokiej jakości rezultatu. Więcej kroków niekoniecznie oznacza lepszą jakość – po pewnym progu dodatkowe kroki mogą nawet pogorszyć obraz. Różne samplery wymagają różnej liczby kroków – niektóre osiągają dobrą jakość już przy 8 krokach, podczas gdy inne potrzebują nawet 40.

Skala CFG (Classifier-Free Guidance)

Skala CFG kontroluje, jak ściśle proces generowania podąża za tekstowym promptem. Wartości między 7 a 10 są zwykle optymalne dla większości zastosowań. Niskie wartości (1-3) dają modelowi więcej swobody twórczej, podczas gdy wysokie wartości (powyżej 12) mogą prowadzić do przesadnego nasycenia kolorów i utraty subtelności. Dla modeli o szybkim próbkowaniu, jak LCM i SDXL Turbo, zalecane są znacznie niższe wartości CFG (1-2).

Wymiary Obrazu

Stable Diffusion został zoptymalizowany dla rozmiaru 512×512 pikseli. Dla innych proporcji zaleca się: 768×512 dla krajobrazów i 512×768 dla portretów. Przekraczanie szerokości lub wysokości 768 pikseli może prowadzić do zniekształceń i artefaktów. Wybór odpowiednich wymiarów ma bezpośredni wpływ na jakość, szczegółowość i czas generowania.

Denoising Strength (dla img2img)

W trybie img2img, ten parametr kontroluje stopień modyfikacji oryginalnego obrazu. Wartości (od 0 do 1) określają balans między oryginalnym obrazem a nową generacją. Niskie wartości (0.25) zachowują więcej z oryginału, podczas gdy wysokie (0.75) mogą całkowicie przekształcić obraz. Nawet niewielka zmiana tego parametru może spowodować znaczącą różnicę w rezultacie.

Podstawowe parametry Stable Diffusion

Metody Próbkowania (Samplers)

Liczba Kroków Próbkowania (Steps)

Skala CFG (Classifier-Free Guidance)

Wymiary Obrazu

Denoising Strength (dla img2img)

Artur Kowynia

Dodaj komentarz Anuluj pisanie odpowiedzi

Metody Próbkowania (Samplers)

Liczba Kroków Próbkowania (Steps)

Skala CFG (Classifier-Free Guidance)

Wymiary Obrazu

Denoising Strength (dla img2img)

Artur Kowynia

Dodaj komentarz Anuluj pisanie odpowiedzi

Powiązane posty

Pliki Cookie

Przegląd Prywatności

Niezbędne Cookies

Cookie preferencji

Marketingowe Cookies