NVIDIA FP4 Precision (NVFP4)

NVIDIA FP4 (NVFP4) to innowacyjny, 4-bitowy format zmiennoprzecinkowy wprowadzony wraz z architekturą procesorów graficznych NVIDIA Blackwell, zoptymalizowany pod kątem wydajnego wnioskowania i trenowania modeli AI. Wykorzystuje on zaawansowaną strategię mikroskalowania blokowego, która grupuje wartości w małe zestawy po 16 elementów, co pozwala na precyzyjne dopasowanie zakresu dynamicznego i minimalizację błędów kwantyzacji. Dzięki zastosowaniu dwupoziomowego skalowania, format ten oferuje niemal dwukrotnie wyższą przepustowość niż FP8, zachowując przy tym wysoką dokładność modeli językowych. Jest to kluczowe rozwiązanie dla skalowania nowoczesnych fabryk AI, znacząco redukujące zapotrzebowanie na pamięć i zwiększające efektywność obliczeniową.

Powiązane posty

Zacznij wpisywać wyszukiwane hasło powyżej i naciśnij Enter, aby wyszukać. Naciśnij ESC, aby anulować.

Powrót do góry