Uważność przyczynowa, zwana także kauzalną, odnosi się do mechanizmu w modelach transformacyjnych, który kontroluje przepływ informacji w sposób zależny od relacji przyczynowych między elementami danych. W kontekście Falcon Perception i jednolitych transformatorów do przetwarzania obrazów i tekstu, oznacza ona uwzględnienie hierarchicznych zależności między częściami obrazu a ich opisami tekstowymi, np. jak elementy wizualne wpływają na znaczenie słów. Pozwala to modelowi lepiej rozumieć złożone relacje, np. jak przedmiot na obrazie determinuje jego opis. Jest kluczowa dla poprawnego łączenia modalności wizualnej i językowej.
uważność przyczynowa (kauzalna)
Reklama





