Top-k to technika filtrowania stosowana w modelach językowych oraz architekturach Mixture of Experts, która polega na ograniczeniu wyboru do k najbardziej prawdopodobnych opcji. W procesie generowania tekstu pozwala to na odrzucenie mniej istotnych tokenów, co zwiększa spójność wypowiedzi, natomiast w modelach rzadkich służy do aktywowania jedynie wybranych, najlepiej dopasowanych ekspertów dla danego zadania.
📖 Dowiedz się więcej w kontekście:
Reklama





