polityka kontrolująca

Polityka kontrolująca (policy) w uczeniu ze wzmocnieniem to mechanizm decyzyjny agenta AI, który określa, jakie działanie należy podjąć w danym stanie środowiska, aby zmaksymalizować przyszłą nagrodę. Funkcjonuje ona jako zestaw reguł lub model probabilistyczny mapujący obserwacje na konkretne akcje, stanowiąc fundament zachowania inteligentnych systemów sterowania i robotyki. Wyróżnia się polityki deterministyczne, przypisujące konkretną reakcję do sytuacji, oraz stochastyczne, które określają prawdopodobieństwo wystąpienia różnych wariantów działania.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry