Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

MMLU

Massive Multitask Language Understanding is a benchmark covering 57 subjects from elementary mathematics to professional law. Each item is a multiple-choice question, and a language model is graded on accuracy. MMLU has become a default headline number on most frontier model release announcements.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.