INT4

INT4 to format zapisu danych wykorzystujący 4 bity, który w kontekście sztucznej inteligencji służy do agresywnej kwantyzacji wag modeli językowych. Technika ta pozwala na ośmiokrotne zmniejszenie rozmiaru modelu w porównaniu do standardowej precyzji 32-bitowej, co znacząco obniża zapotrzebowanie na pamięć VRAM i przyspiesza generowanie odpowiedzi. Stanowi ona popularny kompromis, oferując dużą wydajność przy zachowaniu akceptowalnego poziomu dokładności modelu.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry