BM25 (Best Match 25) to zaawansowany algorytm rankingowy stosowany w wyszukiwarkach tekstowych do oceny trafności dokumentów względem zapytania użytkownika. Stanowi on rozwinięcie modelu TF-IDF, wprowadzając mechanizm nasycenia częstotliwości słów oraz normalizację długości treści, co zapobiega faworyzowaniu bardzo długich dokumentów. Algorytm oblicza wynik na podstawie rzadkości występowania słów w całym zbiorze oraz ich zagęszczenia w konkretnym tekście. Obecnie jest standardem w systemach takich jak Elasticsearch czy Lucene i często stanowi element hybrydowych systemów wyszukiwania informacji.
Best Match 25 (algorytm wyszukiwania tekstowego) (BM25)
Reklama





