stringtranslate.com

Mayoría del estrés

La mayorización de la tensión es una estrategia de optimización utilizada en el escalamiento multidimensional (MDS) donde, para un conjunto de elementos de datos de dimensión , se busca una configuración de puntos en un espacio de dimensión que minimice la llamada función de tensión . Por lo general es o , es decir, la matriz enumera los puntos en el espacio euclidiano de dimensión r para que se pueda visualizar el resultado (es decir, un gráfico MDS ). La función es una función de costo o pérdida que mide las diferencias al cuadrado entre las distancias ideales ( -dimensionales) y las distancias reales en el espacio de dimensión r . Se define como:

donde es un peso para la medición entre un par de puntos , es la distancia euclidiana entre y y es la distancia ideal entre los puntos (su separación) en el espacio de datos de dimensión . Nótese que se puede utilizar para especificar un grado de confianza en la similitud entre puntos (por ejemplo, se puede especificar 0 si no hay información para un par en particular).

Una configuración que minimiza genera un gráfico en el que los puntos que están cerca entre sí corresponden a puntos que también están cerca entre sí en el espacio de datos dimensional original.

Existen muchas formas de minimizarlo. Por ejemplo, Kruskal [1] recomendó un enfoque iterativo de descenso más pronunciado . Sin embargo, Jan de Leeuw introdujo un método significativamente mejor (en términos de garantías y tasa de convergencia) para minimizar el estrés . [2] El método de mayorización iterativo de De Leeuw en cada paso minimiza una función convexa simple que limita desde arriba y toca la superficie de en un punto , llamado punto de apoyo . En el análisis convexo, una función de este tipo se denomina función mayorizadora . Este proceso de mayorización iterativo también se conoce como algoritmo SMACOF ("Escalado mediante mayorización de una función complicada").

El algoritmo SMACOF

La función de estrés se puede desarrollar de la siguiente manera:

Nótese que el primer término es una constante y el segundo término es cuadrático en (es decir, para la matriz hessiana, el segundo término es equivalente a tr ) y, por lo tanto, se resuelve con relativa facilidad. El tercer término está acotado por:

donde tiene:

para

y para

y .

La prueba de esta desigualdad se obtiene mediante la desigualdad de Cauchy-Schwarz , véase Borg [3] (pp. 152-153).

Así, tenemos una función cuadrática simple que mayoriza el estrés:


El procedimiento de minimización iterativa es entonces:

Se ha demostrado que este algoritmo reduce el estrés de forma monótona (véase de Leeuw [2] ).

Uso en el dibujo de gráficos

La mayorización de tensiones y algoritmos similares a SMACOF también tienen aplicación en el campo del dibujo de grafos . [4] [5] Es decir, se puede encontrar un diseño razonablemente atractivo estéticamente para una red o grafo minimizando una función de tensión sobre las posiciones de los nodos en el grafo. En este caso, los se establecen generalmente en las distancias teóricas de grafos entre nodos y y los pesos se toman como . Aquí, se elige como un equilibrio entre preservar distancias ideales de largo o corto alcance. Se han demostrado buenos resultados para . [6]

Referencias

  1. ^ Kruskal, JB (1964), "Escalamiento multidimensional mediante la optimización del ajuste a una hipótesis no métrica", Psychometrika , 29 (1): 1–27, doi :10.1007/BF02289565.
  2. ^ ab de Leeuw, J. (1977), "Aplicaciones del análisis convexo al escalamiento multidimensional", en Barra, JR; Brodeau, F.; Romie, G.; et al. (eds.), Desarrollos recientes en estadística , págs. 133–145.
  3. ^ Borg, I.; Groenen, P. (1997), Escalamiento multidimensional moderno: teoría y aplicaciones , Nueva York: Springer-Verlag.
  4. ^ Michailidis, G.; de Leeuw, J. (2001), "Visualización de datos mediante el dibujo de gráficos", Computation Stat. , 16 (3): 435–450, CiteSeerX 10.1.1.28.9372 , doi :10.1007/s001800100077 .
  5. ^ Gansner, E.; Koren, Y.; North, S. (2004), "Dibujo de gráficos por mayorización de la tensión", Actas del 12.º Simposio Internacional de Dibujo de Gráficos (GD'04) , Notas de clase en Ciencias de la Computación, vol. 3383, Springer-Verlag, págs. 239-250.
  6. ^ Cohen, J. (1997), "Dibujar gráficos para transmitir proximidad: un método de ordenamiento incremental", ACM Transactions on Computer-Human Interaction , 4 (3): 197–229, doi :10.1145/264645.264657.