Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Reinforcement Learning

A training method where an agent takes actions in an environment, receives a reward signal, and updates its policy to earn more reward over time. Reinforcement learning underlies game-playing systems and the human-feedback fine-tuning step used to align modern chat models. The reward function is the design choice that shapes every behavior the agent learns.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.