QDQ (Quantize-Dequantize) to format reprezentacji modeli AI, który polega na wstawianiu par węzłów kwantyzacji i dekwantyzacji przed i po standardowych operacjach w grafie obliczeniowym. Metoda ta pozwala na symulowanie efektów niskiej precyzji podczas treningu lub kalibracji, zapewniając lepszą kontrolę nad procesem konwersji i wyższą kompatybilność z silnikami inferencyjnymi, takimi jak TensorRT czy ONNX Runtime.
📖 Dowiedz się więcej w kontekście:
Reklama





