Fast Implementation of 4-bit Convolutional Neural Networks

Fast Implementation of 4-bit Convolutional Neural Networks to zoptymalizowana metoda wdrażania sieci neuronowych, która wykorzystuje 4-bitową kwantyzację wag i aktywacji w celu przyspieszenia obliczeń na procesorach ogólnego przeznaczenia. Dzięki zastosowaniu specjalnych algorytmów mnożenia macierzy i instrukcji SIMD, rozwiązanie to pozwala na znaczną redukcję zapotrzebowania na pamięć oraz nawet trzykrotne przyspieszenie wnioskowania przy minimalnej utracie dokładności rozpoznawania.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry