La agrupación difusa (también conocida como agrupación suave o k -medias suaves ) es una forma de agrupación en la que cada punto de datos puede pertenecer a más de un grupo.
La agrupación o análisis de conglomerados implica asignar puntos de datos a conglomerados de modo que los elementos del mismo conglomerado sean lo más similares posible, mientras que los elementos que pertenecen a conglomerados diferentes sean lo más diferentes posible. Los conglomerados se identifican mediante medidas de similitud. Estas medidas de similitud incluyen distancia, conectividad e intensidad. Se pueden elegir diferentes medidas de similitud en función de los datos o la aplicación. [1]
En la agrupación no difusa (también conocida como agrupación rígida), los datos se dividen en grupos distintos, donde cada punto de datos solo puede pertenecer a exactamente un grupo. En la agrupación difusa, los puntos de datos pueden pertenecer potencialmente a varios grupos. Por ejemplo, una manzana puede ser roja o verde (agrupación rígida), pero una manzana también puede ser roja Y verde (agrupación difusa). En este caso, la manzana puede ser roja hasta cierto punto y también verde hasta cierto punto. En lugar de que la manzana pertenezca al verde [verde = 1] y no al rojo [rojo = 0], la manzana puede pertenecer al verde [verde = 0,5] y al rojo [rojo = 0,5]. Estos valores se normalizan entre 0 y 1; sin embargo, no representan probabilidades, por lo que no es necesario que los dos valores sumen 1.
A cada uno de los puntos de datos (etiquetas) se le asignan grados de pertenencia. Estos grados de pertenencia indican el grado en que los puntos de datos pertenecen a cada grupo. Por lo tanto, los puntos en el borde de un grupo, con grados de pertenencia más bajos, pueden estar en el grupo en un grado menor que los puntos en el centro del grupo.
Uno de los algoritmos de agrupamiento difuso más utilizados es el algoritmo de agrupamiento difuso C-medias (FCM).
El agrupamiento de medias c difusas (FCM) fue desarrollado por JC Dunn en 1973, [2] y mejorado por JC Bezdek en 1981. [3]
El algoritmo difuso c -means es muy similar al algoritmo k -means :
Cualquier punto x tiene un conjunto de coeficientes que dan el grado de pertenencia al grupo k w k ( x ). Con c -medias difusas, el centroide de un grupo es la media de todos los puntos, ponderada por su grado de pertenencia al grupo o, matemáticamente,
donde m es el hiperparámetro que controla qué tan difuso será el clúster. Cuanto más alto sea, más difuso será el clúster al final.
El algoritmo FCM intenta particionar una colección finita de elementos en una colección de c grupos difusos con respecto a un criterio dado.
Dado un conjunto finito de datos, el algoritmo devuelve una lista de centros de clústeres y una matriz de partición.
, donde cada elemento, , indica el grado en que el elemento, , pertenece al grupo .
El FCM tiene como objetivo minimizar una función objetivo:
dónde:
La agrupación en clústeres de K-medias también intenta minimizar la función objetivo mostrada arriba, excepto que en K-medias, los valores de pertenencia son cero o uno, y no pueden tomar valores intermedios, es decir . En Fuzzy C-means, el grado de imprecisión está parametrizado por , donde un mayor da como resultado clústeres más difusos. En el límite , las pertenencias, , convergen a 0 o 1, y el objetivo de Fuzzy C-means coincide con el de K-medias. En ausencia de experimentación o conocimiento del dominio, se establece comúnmente en 2. El algoritmo también minimiza la varianza intra-clúster, pero tiene los mismos problemas que 'k'-means; el mínimo es un mínimo local, y los resultados dependen de la elección inicial de pesos.
Hay varias implementaciones de este algoritmo que están disponibles públicamente. [4] [5]
Los C-means difusos (FCM) determinados automáticamente para el número de clústeres podrían mejorar la precisión de la detección. [6] El uso de una mezcla de gaussianas junto con el algoritmo de maximización de expectativas es un método estadísticamente más formalizado que incluye algunas de estas ideas: membresía parcial en clases.
Para comprender mejor este principio, se muestra a continuación un ejemplo clásico de datos unidimensionales en el eje x.
Este conjunto de datos se puede agrupar tradicionalmente en dos grupos. Al seleccionar un umbral en el eje x, los datos se separan en dos grupos. Los grupos resultantes se etiquetan como "A" y "B", como se ve en la siguiente imagen. Por lo tanto, cada punto perteneciente al conjunto de datos tendría un coeficiente de pertenencia de 1 o 0. Este coeficiente de pertenencia de cada punto de datos correspondiente se representa mediante la inclusión del eje y.
En la agrupación difusa, cada punto de datos puede pertenecer a varios clústeres. Al relajar la definición de coeficientes de pertenencia de estrictamente 1 o 0, estos valores pueden variar desde cualquier valor entre 1 y 0. La siguiente imagen muestra el conjunto de datos de la agrupación anterior, pero ahora se aplica la agrupación difusa de c-medias. Primero, se puede generar un nuevo valor de umbral que defina dos clústeres. A continuación, se generan nuevos coeficientes de pertenencia para cada punto de datos en función de los centroides de los clústeres, así como de la distancia desde cada centroide de clúster.
Como se puede ver, el punto de datos del medio pertenece al grupo A y al grupo B. El valor de 0,3 es el coeficiente de pertenencia de este punto de datos para el grupo A. [7]
Los problemas de agrupamiento tienen aplicaciones en la ciencia de superficies, la biología, la medicina, la psicología, la economía y muchas otras disciplinas. [8]
En el campo de la bioinformática, la agrupación se utiliza para diversas aplicaciones. Una de ellas es como técnica de reconocimiento de patrones para analizar datos de expresión génica a partir de datos de secuenciación de ARN u otras tecnologías. [9] En este caso, los genes con patrones de expresión similares se agrupan en el mismo grupo, y los diferentes grupos muestran patrones de expresión distintos y bien separados. El uso de la agrupación puede proporcionar información sobre la función y la regulación de los genes. [8] Debido a que la agrupación difusa permite que los genes pertenezcan a más de un grupo, permite la identificación de genes que están co-regulados o co-expresados condicionalmente. [10] Por ejemplo, un gen puede ser afectado por más de un factor de transcripción , y un gen puede codificar una proteína que tiene más de una función. Por lo tanto, la agrupación difusa es más apropiada que la agrupación dura.
El algoritmo FCM ha sido una herramienta muy importante para el procesamiento de imágenes en la agrupación de objetos en una imagen. En la década de 1970, los matemáticos introdujeron el término espacial en el algoritmo FCM para mejorar la precisión de la agrupación en condiciones de ruido. [11] Además, los algoritmos FCM se han utilizado para distinguir entre diferentes actividades utilizando características basadas en imágenes, como los momentos Hu y Zernike. [12] Alternativamente, un modelo de lógica difusa se puede describir en conjuntos difusos que se definen en tres componentes del espacio de color HSL y HSV ; Las funciones de pertenencia tienen como objetivo describir los colores siguiendo la intuición humana de identificación del color. [13]
En marketing, los clientes pueden agruparse en grupos difusos en función de sus necesidades, elecciones de marca, perfiles psicográficos u otras particiones relacionadas con el marketing. [ cita requerida ]
La segmentación de imágenes mediante algoritmos de agrupamiento de k-medias se ha utilizado durante mucho tiempo para el reconocimiento de patrones, la detección de objetos y la obtención de imágenes médicas. Sin embargo, debido a las limitaciones del mundo real, como el ruido, las sombras y las variaciones en las cámaras, el agrupamiento duro tradicional a menudo no puede realizar de manera confiable las tareas de procesamiento de imágenes como se indicó anteriormente. [ cita requerida ] Se ha propuesto el agrupamiento difuso como un algoritmo más aplicable en el desempeño de estas tareas. Se da una imagen en escala de grises que se ha sometido a agrupamiento difuso en Matlab. [14] La imagen original se ve junto a una imagen agrupada. Se utilizan colores para dar una representación visual de los tres grupos distintos utilizados para identificar la pertenencia de cada píxel. A continuación, se proporciona un gráfico que define los coeficientes de pertenencia difusa de sus valores de intensidad correspondientes.
Dependiendo de la aplicación para la que se utilizarán los coeficientes de agrupamiento difuso, se pueden aplicar diferentes técnicas de preprocesamiento a las imágenes RGB . La conversión de RGB a HCL es una práctica común. [15]
{{cite book}}
: |journal=
ignorado ( ayuda )