rectified flow matching

Rectified flow matching (RFM) to model generatywny oparty na równaniach różniczkowych zwyczajnych (ODE), który uczy się przekształcać rozkład szumu w rozkład danych poprzez rozwiązywanie ODE wzdłuż ścieżek generowanych przez wielokrotne pola prędkości. Klasyczna metoda RFM opiera się na interpolacji losowych par danych z rozkładu źródłowego i docelowego, co prowadzi do wielomodalnych pól prędkości. Wariantem ulepszonym jest variational rectified flow matching, który wprowadza zmienną ukrytą, aby modelować i próbować wielomodalne kierunki przepływu, co poprawia jakość generowanych wyników przy zachowaniu wydajności obliczeniowej. Znajduje zastosowanie w generacji obrazów, dźwięku i wideo, a także w zadaniach edycji treści.

Źródło: arxiv.org

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry