Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Backdoor Attack

A poisoning attack that installs a trigger phrase, pattern, or input perturbation that activates an attacker-chosen behavior. The model behaves normally on clean inputs and reveals the backdoor only when the trigger appears. Detection is hard because the model's accuracy on standard benchmarks is unaffected.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.