stringtranslate.com

Mapa autoorganizado en crecimiento

Un mapa autoorganizado en crecimiento (GSOM) es una variante en crecimiento de un mapa autoorganizado (SOM). El GSOM fue desarrollado para abordar la cuestión de identificar un tamaño de mapa adecuado en el SOM . Comienza con una cantidad mínima de nodos (generalmente 4) y desarrolla nuevos nodos en el límite según una heurística. Al utilizar el valor llamado Spread Factor (SF), el analista de datos tiene la capacidad de controlar el crecimiento del GSOM.

Todos los nodos iniciales del GSOM son nodos límite, es decir, cada nodo tiene la libertad de crecer en su propia dirección al principio. (Fig. 1) Los nuevos nodos crecen a partir de los nodos límite. Una vez que se selecciona un nodo para crecer, se desarrollarán nuevos nodos en todas sus posiciones vecinas libres. La figura muestra las tres posibles opciones de crecimiento de nodos para un GSOM rectangular.

Opciones de crecimiento de nodos en GSOM: (a) un nodo nuevo, (b) dos nodos nuevos y (c) tres nodos nuevos.

el algoritmo

El proceso GSOM es el siguiente:

  1. Fase de inicialización:
    1. Inicialice los vectores de peso de los nodos iniciales (generalmente cuatro) con números aleatorios entre 0 y 1.
    2. Calcule el umbral de crecimiento ( ) para el conjunto de datos de dimensión dado de acuerdo con el factor de dispersión ( ) usando la fórmula
  2. Fase de crecimiento:
    1. Presentar entrada a la red.
    2. Determine el vector de peso más cercano al vector de entrada asignado al mapa de características actual (ganador), utilizando la distancia euclidiana (similar al SOM ). Este paso se puede resumir como: encontrar tal que donde , sean los vectores de entrada y peso respectivamente, sea el vector de posición para los nodos y sea el conjunto de números naturales.
    3. La adaptación del vector de peso se aplica sólo a la vecindad del ganador y al propio ganador. El vecindario es un conjunto de neuronas alrededor del ganador, pero en el GSOM el vecindario inicial seleccionado para la adaptación al peso es más pequeño en comparación con el SOM (adaptación de peso localizada). La cantidad de adaptación (tasa de aprendizaje) también se reduce exponencialmente a lo largo de las iteraciones. Incluso dentro del vecindario, los pesos que están más cerca del ganador se adaptan más que los que están más lejos. La adaptación del peso se puede describir donde la tasa de aprendizaje es una secuencia de parámetros positivos que convergen a cero como . , son los vectores de peso del nodo antes y después de la adaptación y es la vecindad de la neurona ganadora en la tercera iteración. El valor decreciente de en el GSOM depende de la cantidad de nodos existentes en el mapa en ese momento .
    4. Aumente el valor de error del ganador (el valor de error es la diferencia entre el vector de entrada y los vectores de peso).
    5. Cuándo (dónde está el error total del nodo y es el umbral de crecimiento). Haga crecer los nodos si i es un nodo límite. Distribuya pesos a los vecinos si es un nodo no límite.
    6. Inicialice los nuevos vectores de peso de nodo para que coincidan con los pesos de los nodos vecinos.
    7. Inicialice la tasa de aprendizaje ( ) a su valor inicial.
    8. Repita los pasos 2 a 7 hasta que se hayan presentado todas las entradas y el crecimiento de los nodos se reduzca al nivel mínimo.
  3. Fase de alisado.
    1. Reduzca la tasa de aprendizaje y arregle un pequeño vecindario inicial.
    2. Encuentre el ganador y adapte los pesos del ganador y de los vecinos de la misma manera que en la fase de crecimiento.
Aproximación de una espiral con ruido mediante 1D SOM (la fila superior) y GSOM (la fila inferior) con 50 (la primera columna) y 100 (la segunda columna) nodos. La fracción de varianza inexplicable es: a) 4,68% (SOM, 50 nodos); b) 1,69% (SOM, 100 nodos); c) 4,20% (GSOM, 50 nodos); d) 2,32% (GSOM, 100 nodos). La aproximación inicial para SOM fue la equidistribución de nodos en un segmento en el primer componente principal con la misma varianza que para el conjunto de datos. La aproximación inicial para GSOM fue el punto medio. [1]

Aplicaciones

El GSOM se puede utilizar para muchas tareas de preprocesamiento en minería de datos , para reducción de dimensionalidad no lineal , para aproximación de curvas y variedades principales, para agrupamiento y clasificación . A menudo ofrece una mejor representación de la geometría de los datos que el SOM (consulte el punto de referencia clásico para las curvas principales a la izquierda).

Referencias

  1. ^ La ilustración está preparada con software gratuito: EM Mirkes, Análisis de componentes principales y mapas autoorganizados: subprograma. Universidad de Leicester, 2011.

Bibliografía

Ver también