Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

AI Benchmark

A standardized test set used to compare models on a defined task. Public benchmarks let teams quote a single number that summarizes capability, but they also create incentives to overfit, leak data, or game the eval. Reading a benchmark score without understanding the test design is a common source of bad procurement decisions.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.