Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Quantization

A technique that reduces the precision of model weights and activations from 16 or 32 bits down to 8, 4, or fewer. The model gets smaller and faster at the cost of a small accuracy drop. Modern quantization methods (GPTQ, AWQ, NF4) preserve most of the original quality.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.