Golden-set to ręcznie kuratowany zbiór danych testowych, składający się z par pytań i wzorcowych odpowiedzi, wykorzystywany do ewaluacji jakości modeli AI. Służy on jako punkt odniesienia do sprawdzania precyzji i wiarygodności generowanych treści, pozwalając na obiektywne mierzenie wydajności systemu RAG.
Reklama




