Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

Quantization

A technique that reduces the precision of model weights and activations from 16 or 32 bits down to 8, 4, or fewer. The model gets smaller and faster at the cost of a small accuracy drop. Modern quantization methods (GPTQ, AWQ, NF4) preserve most of the original quality.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.