Falcon OCR to opracowany przez Technology Innovation Institute (TII) multimodalny model typu vision-language o rozmiarze 300 milionów parametrów, wyspecjalizowany w optycznym rozpoznawaniu znaków. Wykorzystuje on architekturę early-fusion, która pozwala na przetwarzanie obrazów i tekstu w jednej sieci, umożliwiając generowanie czystego tekstu, formuł LaTeX oraz tabel w formacie HTML. Dzięki kompaktowej budowie model oferuje wysoką przepustowość i niskie opóźnienia, zachowując przy tym wysoką precyzję w analizie złożonych układów dokumentów.
Falcon OCR
Reklama




