Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

AI Red Teaming

The practice of probing an AI system for unsafe, biased, or otherwise undesired behavior before deployment. AI red teams combine prompt-injection attacks, jailbreak attempts, capability elicitation, and structured evaluations against safety policies. The discipline draws from cybersecurity red teaming but adds AI-specific attack classes.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.