Tokeny obrazu to dyskretne jednostki informacji wizualnej, powstające najczęściej poprzez podzielenie obrazu na małe, regularne fragmenty zwane patchami. Umożliwiają one modelom opartym na architekturze transformera przetwarzanie danych graficznych w sposób sekwencyjny, podobnie jak ma to miejsce w przypadku słów w tekście. Dzięki takiej reprezentacji systemy AI mogą analizować relacje przestrzenne i rozpoznawać złożone obiekty oraz wzorce na zdjęciach.
📖 Dowiedz się więcej w kontekście:
Reklama





