Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

Explainability

The set of methods that surface why a model produced a particular output. Techniques range from feature attribution (SHAP, LIME) for tabular models to attention visualization and circuit interpretation for neural networks. Frontier work in mechanistic interpretability tries to read concepts directly from the model's internals.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.