stringtranslate.com

Mapa autoorganizado en crecimiento

Un mapa autoorganizado en crecimiento (GSOM, por sus siglas en inglés) es una variante creciente de un mapa autoorganizado (SOM, por sus siglas en inglés). El GSOM se desarrolló para abordar la cuestión de identificar un tamaño de mapa adecuado en el SOM . Comienza con una cantidad mínima de nodos (normalmente 4) y hace crecer nuevos nodos en el límite según una heurística. Al utilizar el valor denominado Factor de propagación (SF, por sus siglas en inglés), el analista de datos tiene la capacidad de controlar el crecimiento del GSOM.

Todos los nodos iniciales del GSOM son nodos límite, es decir, cada nodo tiene la libertad de crecer en su propia dirección al principio. (Fig. 1) Los nuevos nodos se desarrollan a partir de los nodos límite. Una vez que se selecciona un nodo para el crecimiento, todas sus posiciones vecinas libres se convertirán en nuevos nodos. La figura muestra las tres posibles opciones de crecimiento de nodos para un GSOM rectangular.

Opciones de crecimiento de nodos en GSOM: (a) un nuevo nodo, (b) dos nuevos nodos y (c) tres nuevos nodos.

El algoritmo

El proceso GSOM es el siguiente:

  1. Fase de inicialización:
    1. Inicialice los vectores de peso de los nodos iniciales (generalmente cuatro) con números aleatorios entre 0 y 1.
    2. Calcule el umbral de crecimiento ( ) para el conjunto de datos dado de dimensión de acuerdo con el factor de propagación ( ) utilizando la fórmula
  2. Fase de crecimiento:
    1. Presentar entrada a la red.
    2. Determine el vector de peso que está más cerca del vector de entrada asignado al mapa de características actual (ganador), utilizando la distancia euclidiana (similar al SOM ). Este paso se puede resumir como: encuentre tal que donde , son los vectores de entrada y peso respectivamente, es el vector de posición para los nodos y es el conjunto de números naturales.
    3. La adaptación del vector de peso se aplica solo al vecindario del ganador y al ganador mismo. El vecindario es un conjunto de neuronas alrededor del ganador, pero en el GSOM el vecindario inicial seleccionado para la adaptación de peso es más pequeño en comparación con el SOM (adaptación de peso localizada). La cantidad de adaptación (tasa de aprendizaje) también se reduce exponencialmente a lo largo de las iteraciones. Incluso dentro del vecindario, los pesos que están más cerca del ganador se adaptan más que los que están más lejos. La adaptación de peso se puede describir por donde la tasa de aprendizaje , es una secuencia de parámetros positivos que convergen a cero como . , son los vectores de peso del nodo antes y después de la adaptación y es el vecindario de la neurona ganadora en la iteración th. El valor decreciente de en el GSOM depende de la cantidad de nodos existentes en el mapa en el momento .
    4. Aumente el valor de error del ganador (el valor de error es la diferencia entre el vector de entrada y los vectores de peso).
    5. Cuando (donde es el error total del nodo y es el umbral de crecimiento). Aumentar los nodos si i es un nodo límite. Distribuir pesos a los vecinos si es un nodo no límite.
    6. Inicialice los nuevos vectores de peso de los nodos para que coincidan con los pesos de los nodos vecinos.
    7. Inicialice la tasa de aprendizaje ( ) a su valor inicial.
    8. Repita los pasos 2 a 7 hasta que se hayan presentado todas las entradas y el crecimiento de los nodos se haya reducido a un nivel mínimo.
  3. Fase de suavizado.
    1. Reducir la tasa de aprendizaje y arreglar un pequeño vecindario inicial.
    2. Encuentra al ganador y adapta los pesos del ganador y los vecinos de la misma manera que en la fase de crecimiento.
Aproximación de una espiral con ruido mediante SOM 1D (la fila superior) y GSOM (la fila inferior) con 50 (la primera columna) y 100 (la segunda columna) nodos. La fracción de varianza no explicada es: a) 4,68% (SOM, 50 nodos); b) 1,69% (SOM, 100 nodos); c) 4,20% (GSOM, 50 nodos); d) 2,32% (GSOM, 100 nodos). La aproximación inicial para SOM fue la equidistribución de nodos en un segmento en el primer componente principal con la misma varianza que para el conjunto de datos. La aproximación inicial para GSOM fue el punto medio. [1]

Aplicaciones

El GSOM se puede utilizar para muchas tareas de preprocesamiento en minería de datos , para reducción de dimensionalidad no lineal , para aproximación de curvas principales y variedades, para agrupamiento y clasificación . A menudo proporciona una mejor representación de la geometría de los datos que el SOM (consulte el punto de referencia clásico para curvas principales a la izquierda).

Referencias

  1. ^ La ilustración se preparó utilizando software libre: EM Mirkes, Principal Component Analysis and Self-Organizing Maps: applet. Universidad de Leicester, 2011.

Bibliografía

Véase también