Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Explainability

The set of methods that surface why a model produced a particular output. Techniques range from feature attribution (SHAP, LIME) for tabular models to attention visualization and circuit interpretation for neural networks. Frontier work in mechanistic interpretability tries to read concepts directly from the model's internals.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.