AI Evaluation (Evals)
The systematic measurement of LLM application behavior against a defined task and dataset. Evaluation covers capability (does the model do the task), safety (does the model refuse where it should), fairness (does the model perform across groups), and grounding (does the model cite its sources correctly).
Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.
Continue por aqui
Três opções conforme onde você está no caminho. As duas primeiras são gratuitas.
Gratuito · 2 minutos
Comece pelo AI Risk Score
Dois minutos. Mostra o quanto seu role atual está exposto à automação por IA e quais movimentos defensivos têm melhor retorno.
Começar AI Risk Score →Programa pago · $147-$597
Curso alinhado: Transição de Carreira
Programa com projeto final revisado pelo fundador, rubrica pública, e credencial verificável assinada com Ed25519.
Ver o curso →Conta gratuita
Salve seus resultados e acompanhe seu progresso
Uma conta gratuita guarda suas avaliações, recomendações e a versão exportável do seu Career DNA. Sem cartão.
Criar conta →As definições são explicações originais escritas para fins de desenvolvimento profissional. Para definições técnicas autoritativas, consulte NIST, ISO ou o órgão de normalização correspondente.