Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

LLM-as-Judge

An evaluation pattern where one LLM grades the outputs of another LLM (or itself) against a rubric. LLM-as-judge scales evaluation when human grading is too slow or expensive but introduces bias risks (the judge inherits the judged model's blind spots) that the evaluation design must mitigate.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.