Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Model Evasion Attack

An adversarial attack that crafts input designed to cause a deployed model to produce wrong output while appearing benign to a human reviewer. Includes adversarial examples for image classifiers, perturbed text for spam filters, and jailbreak prompts for LLM content filters. Named in the NIST AI 100-2 e2025 taxonomy.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.