Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

LLM-as-Judge

An evaluation pattern where one LLM grades the outputs of another LLM (or itself) against a rubric. LLM-as-judge scales evaluation when human grading is too slow or expensive but introduces bias risks (the judge inherits the judged model's blind spots) that the evaluation design must mitigate.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.