Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

AI Red Teaming

The practice of probing an AI system for unsafe, biased, or otherwise undesired behavior before deployment. AI red teams combine prompt-injection attacks, jailbreak attempts, capability elicitation, and structured evaluations against safety policies. The discipline draws from cybersecurity red teaming but adds AI-specific attack classes.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.