Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

Model Evasion Attack

An adversarial attack that crafts input designed to cause a deployed model to produce wrong output while appearing benign to a human reviewer. Includes adversarial examples for image classifiers, perturbed text for spam filters, and jailbreak prompts for LLM content filters. Named in the NIST AI 100-2 e2025 taxonomy.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.