Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

Backdoor Attack

A poisoning attack that installs a trigger phrase, pattern, or input perturbation that activates an attacker-chosen behavior. The model behaves normally on clean inputs and reveals the backdoor only when the trigger appears. Detection is hard because the model's accuracy on standard benchmarks is unaffected.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.