Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

Evaluation Set

A held-out collection of examples used to measure model performance after training. A good eval set reflects the real distribution the model will face, includes hard cases, and is kept separate from training data. Teams often maintain multiple eval sets for capability, safety, and regression testing.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.