INT8

INT8 to 8-bitowy format zapisu liczb całkowitych, wykorzystywany w procesie kwantyzacji modeli sztucznej inteligencji do redukcji ich rozmiaru. Dzięki zastąpieniu precyzyjnych wag 16- lub 32-bitowych mniejszymi jednostkami, możliwe jest znaczne przyspieszenie wnioskowania i zmniejszenie zużycia pamięci przy minimalnym spadku dokładności. Format ten jest szczególnie istotny przy wdrażaniu modeli na urządzeniach brzegowych i mobilnych o ograniczonej mocy obliczeniowej.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry