En el campo del aprendizaje automático y específicamente en el problema de la clasificación estadística , una matriz de confusión , también conocida como matriz de error , [1] es un diseño de tabla específico que permite visualizar el rendimiento de un algoritmo, típicamente uno de aprendizaje supervisado ; en el aprendizaje no supervisado se le suele llamar matriz de emparejamiento .
Cada fila de la matriz representa las instancias de una clase real, mientras que cada columna representa las instancias de una clase predicha, o viceversa; ambas variantes se encuentran en la literatura. [2] Por lo tanto, la diagonal de la matriz representa todas las instancias que se predicen correctamente. [3] El nombre se debe al hecho de que facilita ver si el sistema está confundiendo dos clases (es decir, comúnmente etiquetando incorrectamente una como otra).
Es un tipo especial de tabla de contingencia , con dos dimensiones ("real" y "prevista") y conjuntos idénticos de "clases" en ambas dimensiones (cada combinación de dimensión y clase es una variable en la tabla de contingencia).
Dada una muestra de 12 individuos, 8 a los que se les ha diagnosticado cáncer y 4 que están libres de cáncer, donde los individuos con cáncer pertenecen a la clase 1 (positivos) y los individuos sin cáncer pertenecen a la clase 0 (negativos), podemos mostrar esos datos de la siguiente manera:
Supongamos que tenemos un clasificador que distingue entre individuos con y sin cáncer de alguna manera. Podemos tomar los 12 individuos y pasarlos por el clasificador. El clasificador entonces hace 9 predicciones precisas y falla en 3: 2 individuos con cáncer que se predijo erróneamente que no tendrían cáncer (muestra 1 y 2) y 1 persona sin cáncer que se predijo erróneamente que tendría cáncer (muestra 9).
Tenga en cuenta que, si comparamos el conjunto de clasificación real con el conjunto de clasificación previsto, hay 4 resultados diferentes que podrían resultar en cualquier columna en particular. Uno, si la clasificación real es positiva y la clasificación prevista es positiva (1,1), esto se llama un resultado positivo verdadero porque la muestra positiva fue identificada correctamente por el clasificador. Dos, si la clasificación real es positiva y la clasificación prevista es negativa (1,0), esto se llama un resultado negativo falso porque la muestra positiva es identificada incorrectamente por el clasificador como negativa. Tercero, si la clasificación real es negativa y la clasificación prevista es positiva (0,1), esto se llama un resultado positivo falso porque la muestra negativa es identificada incorrectamente por el clasificador como positiva. Cuarto, si la clasificación real es negativa y la clasificación prevista es negativa (0,0), esto se llama un resultado negativo verdadero porque la muestra negativa es identificada correctamente por el clasificador.
Luego podemos realizar la comparación entre las clasificaciones reales y previstas y agregar esta información a la tabla, haciendo que los resultados correctos aparezcan en verde para que sean más fácilmente identificables.
La plantilla para cualquier matriz de confusión binaria utiliza los cuatro tipos de resultados analizados anteriormente (verdaderos positivos, falsos negativos, falsos positivos y verdaderos negativos) junto con las clasificaciones positivas y negativas. Los cuatro resultados se pueden formular en una matriz de confusión 2×2 , de la siguiente manera:
La convención de color de las tres tablas de datos anteriores se eligió para que coincidiera con esta matriz de confusión, a fin de diferenciar fácilmente los datos.
Ahora, podemos simplemente sumar cada tipo de resultado, sustituirlo en la plantilla y crear una matriz de confusión que resumirá de manera concisa los resultados de la prueba del clasificador:
En esta matriz de confusión, de las 8 muestras con cáncer, el sistema juzgó que 2 estaban libres de cáncer y, de las 4 muestras sin cáncer, predijo que 1 sí tenía cáncer. Todas las predicciones correctas se encuentran en la diagonal de la tabla (resaltadas en verde), por lo que es fácil inspeccionar visualmente la tabla para detectar errores de predicción, ya que los valores fuera de la diagonal los representarán. Al sumar las 2 filas de la matriz de confusión, también se puede deducir el número total de muestras positivas (P) y negativas (N) en el conjunto de datos original, es decir, y .
En el análisis predictivo , una tabla de confusión (a veces también llamada matriz de confusión ) es una tabla con dos filas y dos columnas que informa la cantidad de verdaderos positivos , falsos negativos , falsos positivos y verdaderos negativos . Esto permite un análisis más detallado que simplemente observar la proporción de clasificaciones correctas (precisión). La precisión producirá resultados engañosos si el conjunto de datos no está equilibrado; es decir, cuando la cantidad de observaciones en diferentes clases varía en gran medida.
Por ejemplo, si hubiera 95 muestras de cáncer y solo 5 muestras no cancerosas en los datos, un clasificador particular podría clasificar todas las observaciones como cancerosas. La precisión general sería del 95%, pero con más detalle, el clasificador tendría una tasa de reconocimiento del 100% ( sensibilidad ) para la clase de cáncer, pero una tasa de reconocimiento del 0% para la clase de no cáncer. La puntuación F1 es aún menos confiable en tales casos, y aquí arrojaría más del 97,4%, mientras que la información elimina dicho sesgo y arroja 0 como la probabilidad de una decisión informada para cualquier forma de adivinación (aquí siempre adivinando cáncer).
Según Davide Chicco y Giuseppe Jurman, la métrica más informativa para evaluar una matriz de confusión es el coeficiente de correlación de Matthews (MCC) . [11]
Se pueden incluir otras métricas en una matriz de confusión, cada una de ellas teniendo su significado y uso.
La matriz de confusión no se limita a la clasificación binaria y también se puede utilizar en clasificadores multiclase. Las matrices de confusión analizadas anteriormente tienen solo dos condiciones: positiva y negativa. Por ejemplo, la tabla siguiente resume la comunicación de un lenguaje silbado entre dos hablantes, omitiendo los valores cero para mayor claridad. [20]