Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

MMLU

Massive Multitask Language Understanding is a benchmark covering 57 subjects from elementary mathematics to professional law. Each item is a multiple-choice question, and a language model is graded on accuracy. MMLU has become a default headline number on most frontier model release announcements.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.