HumanEval
A code-generation benchmark from OpenAI consisting of 164 hand-written Python problems with unit tests. Models are graded on whether their generated code passes the tests, usually reported as pass@1 or pass@10. HumanEval is the most cited code benchmark, though newer benchmarks address its limited scope.
Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.
Continue por aqui
Três opções conforme onde você está no caminho. As duas primeiras são gratuitas.
Gratuito · 2 minutos
Comece pelo AI Risk Score
Dois minutos. Mostra o quanto seu role atual está exposto à automação por IA e quais movimentos defensivos têm melhor retorno.
Começar AI Risk Score →Programa pago · $147-$597
Curso alinhado: Transição de Carreira
Programa com projeto final revisado pelo fundador, rubrica pública, e credencial verificável assinada com Ed25519.
Ver o curso →Conta gratuita
Salve seus resultados e acompanhe seu progresso
Uma conta gratuita guarda suas avaliações, recomendações e a versão exportável do seu Career DNA. Sem cartão.
Criar conta →As definições são explicações originais escritas para fins de desenvolvimento profissional. Para definições técnicas autoritativas, consulte NIST, ISO ou o órgão de normalização correspondente.