Fuzzy clustering

[1]​ Esto se logra representando la similitud entre un elemento y un grupo por una función, llamada función de pertenencia, que toma valores entre cero y uno.Los valores cercanos a uno indican una mayor similitud, mientras que los cercanos a cero indican una menor similitud.Por lo tanto, el problema del agrupamiento difuso se reduce a encontrar una caracterización de este tipo que sea óptima.[2]​ Una partición difusa es una partición que caracteriza la participación de cada muestra en todos los grupos utilizando funciones de pertenencia que toman valores entre cero y uno.Además, cumplen que para cada muestra la suma de sus participaciones en cada grupo es uno.De esta forma, es posible traducir el problema del agrupamiento difuso en encontrar una partición difusa óptima.A continuación se encuentra una definición más formal de este concepto.Sea X = (x1,...,xn) un subconjunto de un espacio euclidiano de dimensión s y c un entero positivo mayor que uno.que cumplen que: Las particiones difusas se representan como una matriz asociando cada fila a uno de los c grupos y cada columna a uno de los elementos de X, de forma tal que el valor en la fila i y la columna j indique la pertenencia del elemento j al grupo i.Más formalmente, el conjunto de las particiones difusas se puede definir como: Los algoritmos Fuzzy c-Means son algunos de los principales algoritmos utilizados en el agrupamiento difuso y pertenecen a una clase de algoritmos basados en funciones objetivo.El procedimiento, en sentido general, consiste en minimizar iterativamente esta función hasta obtener una partición difusa óptima.Se han propuesto varios criterios de agrupamiento para obtener la partición difusa óptima para X, pero el más popular hasta el momento está asociado con la función de error mínimo cuadrático:[1]​ El valorindica la distancia cuadrada entre los elementos de X y los centros de los grupos y puede calcularse utilizando la siguiente fórmula: donde: En particular, si A es la matriz identidad,Los algoritmos Possibilistic c-Means aparecen con el objetivo de resolver el mal comportamiento de los algoritmos Fuzzy c-Means al ser utilizados en conjuntos de datos con mucho ruido.Por lo tanto, las restricciones en la definición de partición difusa podrían reescribirse como: Una de las funciones objetivos más utilizadas por estos algoritmos es la siguiente:[3]​ Esta es la misma función objetivo de los algoritmos Fuzzy c-Means con un término añadido que impide que la partición obtenida sea la solución trivial donde todos los valores de pertenencia sean iguales a cero.denotan la distancia desde el centro del grupo i a la que el grado de pertenencia de un elemento es 0.5.Estos valores determinan el tamaño y forma de sus grupo correspondiente y generalmente se calculan utilizando la siguiente fórmula:[3]​ donde K es normalmente uno.