Best Match 25 (algorytm wyszukiwania tekstowego) (BM25)

BM25 (Best Match 25) to zaawansowany algorytm rankingowy stosowany w wyszukiwarkach tekstowych do oceny trafności dokumentów względem zapytania użytkownika. Stanowi on rozwinięcie modelu TF-IDF, wprowadzając mechanizm nasycenia częstotliwości słów oraz normalizację długości treści, co zapobiega faworyzowaniu bardzo długich dokumentów. Algorytm oblicza wynik na podstawie rzadkości występowania słów w całym zbiorze oraz ich zagęszczenia w konkretnym tekście. Obecnie jest standardem w systemach takich jak Elasticsearch czy Lucene i często stanowi element hybrydowych systemów wyszukiwania informacji.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry