QDQ (Quantize-Dequantize)

QDQ (Quantize-Dequantize) to format reprezentacji modeli AI, który polega na wstawianiu par węzłów kwantyzacji i dekwantyzacji przed i po standardowych operacjach w grafie obliczeniowym. Metoda ta pozwala na symulowanie efektów niskiej precyzji podczas treningu lub kalibracji, zapewniając lepszą kontrolę nad procesem konwersji i wyższą kompatybilność z silnikami inferencyjnymi, takimi jak TensorRT czy ONNX Runtime.

Reklama

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry