PageIndex to system indeksowania dokumentów, który przekształca długie treści w hierarchiczną strukturę drzewa przypominającą inteligentny spis treści. Zamiast dzielić tekst na przypadkowe fragmenty i używać wyszukiwania wektorowego, rozwiązanie to pozwala modelom LLM na logiczne nawigowanie po naturalnych sekcjach dokumentu, takich jak rozdziały czy sceny. Dzięki takiemu podejściu systemy RAG mogą odnajdywać informacje poprzez rozumowanie i analizę struktury, co znacząco zwiększa precyzję odpowiedzi w przypadku złożonych raportów finansowych czy dokumentów prawnych. Jest to metoda bezwektorowa, która naśladuje sposób, w jaki ludzki ekspert korzysta z indeksu książki, aby szybko dotrzeć do konkretnej wiedzy.
System hierarchicznego indeksowania dokumentów (PageIndex)
Reklama





