Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Evaluation Set

A held-out collection of examples used to measure model performance after training. A good eval set reflects the real distribution the model will face, includes hard cases, and is kept separate from training data. Teams often maintain multiple eval sets for capability, safety, and regression testing.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.