Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

AI Alignment

The research and engineering work that aims to make an AI system pursue goals its developers and users actually intend. Alignment covers reward design, evaluation, training methods such as RLHF and DPO, and the broader question of whether a model's behavior is honest, helpful, and harmless. The field is closely tied to AI safety.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.