Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Reinforcement Learning from Human Feedback

A training procedure that uses human-rated examples to teach a language model which responses are preferred. The pipeline typically trains a reward model on those ratings, then uses reinforcement learning to update the language model so it earns higher reward. RLHF is the technique that turned base GPT-style models into helpful assistants.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.