Método de evaluación en el análisis de conglomerados
El índice de Fowlkes-Mallows es un método de evaluación externa que se utiliza para determinar la similitud entre dos agrupaciones (agrupaciones obtenidas después de un algoritmo de agrupamiento ), y también una métrica para medir matrices de confusión . Esta medida de similitud podría ser entre dos agrupaciones jerárquicas o entre una agrupación y una clasificación de referencia. Un valor más alto para el índice de Fowlkes-Mallows indica una mayor similitud entre las agrupaciones y las clasificaciones de referencia. Fue inventado por los estadísticos de Bell Labs Edward Fowlkes y Collin Mallows en 1983. [1]
Preliminares
El índice de Fowlkes-Mallows , cuando se utilizan los resultados de dos algoritmos de agrupamiento para evaluar los resultados, se define como [2]
donde es el número de verdaderos positivos , es el número de falsos positivos y es el número de falsos negativos . es la tasa de verdaderos positivos , también llamada sensibilidad o recuperación , y es la tasa predictiva positiva , también conocida como precisión .
El valor mínimo posible del índice de Fowlkes-Mallows es 0, que corresponde a la peor clasificación binaria posible, donde todos los elementos han sido mal clasificados. Y el valor máximo posible del índice de Fowlkes-Mallows es 1, que corresponde a la mejor clasificación binaria posible, donde todos los elementos han sido perfectamente clasificados.
Definición
Considere dos agrupaciones jerárquicas de objetos etiquetados como y . Los árboles y se pueden cortar para producir agrupaciones para cada árbol (ya sea seleccionando agrupaciones a una altura particular del árbol o configurando una intensidad diferente de la agrupación jerárquica). Para cada valor de , se puede crear la siguiente tabla
donde es de objetos comunes entre el º grupo de y el º grupo de . El índice de Fowlkes-Mallows para el valor específico de se define entonces como
dónde
Luego se puede calcular para cada valor de y la similitud entre los dos agrupamientos se puede mostrar al representar gráficamente frente a . Para cada uno tenemos .
El índice de Fowlkes-Mallows también se puede definir en función de la cantidad de puntos que son comunes o poco comunes en las dos agrupaciones jerárquicas. Si definimos
- como el número de pares de puntos que están presentes en el mismo clúster tanto en como en .
- como el número de pares de puntos que están presentes en el mismo grupo en pero no en .
- como el número de pares de puntos que están presentes en el mismo grupo en pero no en .
- como el número de pares de puntos que están en diferentes grupos tanto en como en .
Se puede demostrar que los cuatro recuentos tienen la siguiente propiedad
y que el índice de Fowlkes-Mallows para dos agrupamientos se puede definir como [3]
- donde es el número de verdaderos positivos , es el número de falsos positivos y es el número de falsos negativos .
- es la tasa positiva verdadera , también llamada sensibilidad o recuperación , y es la tasa predictiva positiva , también conocida como precisión .
- El índice de Fowlkes-Mallows es la media geométrica de la precisión y la recuperación . [4]
Discusión
Dado que el índice es directamente proporcional al número de verdaderos positivos, un índice más alto significa una mayor similitud entre los dos agrupamientos utilizados para determinar el índice. Una forma básica de probar la validez de este índice es comparar dos agrupamientos que no están relacionados entre sí. Fowlkes y Mallows demostraron que al utilizar dos agrupamientos no relacionados, el valor de este índice se acerca a cero a medida que aumenta el número total de puntos de datos elegidos para el agrupamiento; mientras que el valor del índice de Rand para los mismos datos se acerca rápidamente a [1], lo que hace que el índice de Fowlkes-Mallows sea una representación mucho más precisa para datos no relacionados. Este índice también funciona bien si se agrega ruido a un conjunto de datos existente y se compara su similitud. Fowlkes y Mallows demostraron que el valor del índice disminuye a medida que aumenta el componente del ruido. El índice también mostró similitud incluso cuando el conjunto de datos ruidoso tenía un número diferente de agrupamientos que los agrupamientos del conjunto de datos original. Por lo tanto, lo convierte en una herramienta confiable para medir la similitud entre dos agrupamientos.
Lectura adicional
- Chicco, Davide; Jurman, Giuseppe (2023). "Una comparación estadística entre el coeficiente de correlación de Matthews (MCC), el umbral de prevalencia y el índice de Fowlkes-Mallows". Revista de Informática Biomédica . 144 (104426): 1–7. doi :10.1016/j.jbi.2023.104426. hdl : 10281/430040 . PMID 37352899. S2CID 259240662.
Véase también
Referencias
- ^ ab Fowlkes, EB; Mallows, CL (1 de septiembre de 1983). "Un método para comparar dos agrupaciones jerárquicas". Revista de la Asociación Estadounidense de Estadística . 78 (383): 553. doi :10.2307/2288117.
- ^ Halkidi, Maria; Batistakis, Yannis; Vazirgiannis, Michalis (1 de enero de 2001). "Sobre técnicas de validación de agrupamiento". Journal of Intelligent Information Systems . 17 (2/3): 107–145. doi :10.1023/A:1012801612483.
- ^ MEILA, M (1 de mayo de 2007). "Comparación de agrupamientos: una distancia basada en la información". Journal of Multivariate Analysis . 98 (5): 873–895. doi : 10.1016/j.jmva.2006.11.013 .
- ^ Tharwat A (agosto de 2018). "Métodos de evaluación de la clasificación". Computación e informática aplicada . doi : 10.1016/j.aci.2018.08.003 .
Enlaces externos
- Implementación del índice de Fowlkes-Mallows Archivado el 3 de junio de 2016 en Wayback Machine en R .