Falcon OCR

Falcon OCR to opracowany przez Technology Innovation Institute (TII) multimodalny model typu vision-language o rozmiarze 300 milionów parametrów, wyspecjalizowany w optycznym rozpoznawaniu znaków. Wykorzystuje on architekturę early-fusion, która pozwala na przetwarzanie obrazów i tekstu w jednej sieci, umożliwiając generowanie czystego tekstu, formuł LaTeX oraz tabel w formacie HTML. Dzięki kompaktowej budowie model oferuje wysoką przepustowość i niskie opóźnienia, zachowując przy tym wysoką precyzję w analizie złożonych układów dokumentów.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry