Jak powiększać zdjęcia w Stable Diffusion?

poradniki

Mimo że Stable Diffusion to jedno z najpotężniejszych narzędzi do generowania obrazów przy użyciu sztucznej inteligencji to domyślnie modele obsługują dość niskie rozdzielczości. W tym krótkim poradniku dowiesz się jak powiększać zdjęcia oraz skąd brać modele do powiększania (z ang. upscalingu).

Jeśli nie zacząłeś przygody z generowaniem obrazów odwiedź poradnik.

Upscaling zdjęć

Jeśli chcesz rozpocząć przygodę z upscalingiem w Stable Diffusion, warto zacząć od zrozumienia, czym właściwie jest ten proces. Upscaling polega na zwiększeniu rozdzielczości obrazu przy jednoczesnym zachowaniu (lub poprawie) jego jakości. W Stable Diffusion najpopularniejszym sposobem jest wykorzystanie narzędzi takich jak ESRGAN lub Real-ESRGAN, które można łatwo zintegrować z interfejsami jak AUTOMATIC1111.
By to zrobić musisz przejść do zakładki extras.

Operacja jest bardzo prosta bo wystarczy przeciągnąć lub wybrać obraz i wybrać z listy Upscaler 1 oraz Upscaler 2 interesujące cię domyślne modele.
W przypadku gdy generujesz dużą ilość grafik (nie tylko ty chcesz sprzedawać je na Adobe Stock 😉 ) jest opcja wskazania całego folderu co zrobisz klikając Batch from Directory oraz w polach na tekst wskazując ścieżkę bezpośrednią do folderu z obrazami oraz gdzie ma zapisywać przetworzone jak to możesz zauważyć poniżej.

Następnym krokiem jest wybranie rozmiaru powiększania i są do wyboru dwie opcje:

  • Scale by – która powiększa mnożąc obecny rozmiar o liczbę którą wybierzesz
  • Scale to – która powiększa do konkretnego rozmiaru

Który tryb powiększania oraz jakie ustawienia wybrać zawsze zależą od tego jakie grafiki generujesz, stylu obrazu i szczegółów w obrazie i nie da się jednoznacznie wskazać najlepszych opcji o czym przekonasz się w następnym punkcie z pobieraniem niestandardowych modeli.

Modele niestandardowe

Miejscem w którym umieszcza się modele znajduje się w folderze models są w formacie pth.
Poniżej znajduje się tabela które modele lepiej sprawują się w jakich stylach graficznych.

ArchitekturaWbudowana w AUTOMATIC1111Wymaga instalacjiPrzeznaczenie
RealESRGAN✔️Fotorealizm, anime
SwinIR✔️Uniwersalny, detale
LDSR✔️Najwyższa jakość, latent space
UltraSharp✔️Ilustracje, ostrość
4x-foolhardy-Remacri✔️Ilustracje, stylizacje
Ultimate SD Upscale✔️ (rozszerzenie)Kafelki, duże obrazy
ControlNet Tile Upscale✔️ (rozszerzenie)Zaawansowany, precyzyjna

Skąd pobierać?

Najpopularniejszym źródłem jest strona openmodeldb gdzie jest szeroki wybór udostępnionych pozycji oraz można porównać działanie na konkretnych grafikach.


Gdy już wybierzesz pobierasz i plik przenosisz do folderu z jakiej jest on architektury dla przykładu


wystarczy umieścić w folderze np. models/ESRGAN/ a następnie zrestartować środowisko poprzez zakładkę Settings i Reload UI, wtedy pojawi się na liście w upscallingu.

Źródła

🧠 Utrwal wiedzę z tego artykułu!

Kliknij pojęcie, by przypomnieć sobie definicję.

pth
?
Plik .pth to format zapisu używany w bibliotece PyTorch do przechowywania stanów modelu, takich jak wagi, biasy i inne parametry...
Czytaj pełną definicję

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry