Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

HumanEval

A code-generation benchmark from OpenAI consisting of 164 hand-written Python problems with unit tests. Models are graded on whether their generated code passes the tests, usually reported as pass@1 or pass@10. HumanEval is the most cited code benchmark, though newer benchmarks address its limited scope.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.

Continue por aqui

Três opções conforme onde você está no caminho. As duas primeiras são gratuitas.

Gratuito · 2 minutos

Comece pelo AI Risk Score

Dois minutos. Mostra o quanto seu role atual está exposto à automação por IA e quais movimentos defensivos têm melhor retorno.

Começar AI Risk Score →

Programa pago · $147-$597

Curso alinhado: Transição de Carreira

Programa com projeto final revisado pelo fundador, rubrica pública, e credencial verificável assinada com Ed25519.

Ver o curso →

Conta gratuita

Salve seus resultados e acompanhe seu progresso

Uma conta gratuita guarda suas avaliações, recomendações e a versão exportável do seu Career DNA. Sem cartão.

Criar conta →

As definições são explicações originais escritas para fins de desenvolvimento profissional. Para definições técnicas autoritativas, consulte NIST, ISO ou o órgão de normalização correspondente.