ART (Agent Reinforcement Trainer)

ART (Agent Reinforcement Trainer) to otwartoźródłowy szkielet programistyczny (framework) opracowany przez OpenPipe, służący do trenowania agentów opartych na dużych modelach językowych za pomocą uczenia przez wzmacnianie (RL). Wykorzystuje on algorytm GRPO, aby umożliwić modelom naukę na podstawie własnych doświadczeń i automatycznych systemów nagród, co znacząco poprawia ich niezawodność oraz skuteczność w zadaniach wieloturowych.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry