stringtranslate.com

Mapa topográfico generativo.

El mapa topográfico generativo ( GTM ) es un método de aprendizaje automático que es una contraparte probabilística del mapa autoorganizado (SOM), es probablemente convergente y no requiere una vecindad cada vez más pequeña o un tamaño de paso decreciente. Es un modelo generativo : se supone que los datos surgen al seleccionar primero probabilísticamente un punto en un espacio de baja dimensión, mapear el punto al espacio de entrada de alta dimensión observado (a través de una función suave) y luego agregar ruido en ese espacio. Los parámetros de la distribución de probabilidad de baja dimensión, el mapa suave y el ruido se aprenden de los datos de entrenamiento utilizando el algoritmo de maximización de expectativas (EM) . GTM se introdujo en 1996 en un artículo de Christopher Bishop , Markus Svensen y Christopher KI Williams.

Detalles del algoritmo

El enfoque está fuertemente relacionado con las redes de densidad que utilizan muestreo de importancia y un perceptrón multicapa para formar un modelo de variable latente no lineal . En el GTM, el espacio latente es una cuadrícula discreta de puntos que se supone que se proyecta de forma no lineal en el espacio de datos. Luego se hace una suposición de ruido gaussiano en el espacio de datos para que el modelo se convierta en una mezcla restringida de gaussianos . Entonces, EM puede maximizar la probabilidad del modelo.

En teoría, se podría utilizar una deformación paramétrica no lineal arbitraria. Los parámetros óptimos podrían encontrarse mediante descenso de gradiente, etc.

El enfoque sugerido para el mapeo no lineal es utilizar una red de funciones de base radial (RBF) para crear un mapeo no lineal entre el espacio latente y el espacio de datos. Los nodos de la red RBF forman entonces un espacio de características y el mapeo no lineal puede tomarse como una transformación lineal de este espacio de características. Este enfoque tiene la ventaja sobre el enfoque de red de densidad sugerido de que puede optimizarse analíticamente.

Usos

En el análisis de datos, los GTM son como una versión no lineal del análisis de componentes principales , que permite modelar datos de alta dimensión como resultado del ruido gaussiano agregado a fuentes en un espacio latente de menor dimensión. Por ejemplo, para ubicar acciones en un espacio 2D trazable en función de sus formas de series temporales de alta dimensión. Es posible que otras aplicaciones quieran tener menos fuentes que puntos de datos, por ejemplo, modelos mixtos.

En el modelado deformacional generativo, los espacios latente y de datos tienen las mismas dimensiones, por ejemplo, imágenes 2D o 1 onda sonora de audio. Se agregan dimensiones "vacías" adicionales a la fuente (conocida como "plantilla" en esta forma de modelado), por ejemplo, ubicando la onda de sonido 1D en un espacio 2D. Luego se agregan más dimensiones no lineales, obtenidas combinando las dimensiones originales. Luego, el espacio latente ampliado se proyecta nuevamente en el espacio de datos 1D. La probabilidad de una proyección dada está, como antes, dada por el producto de la probabilidad de los datos bajo el modelo de ruido gaussiano con el parámetro anterior de deformación. A diferencia del modelado de deformación convencional basado en resortes, este tiene la ventaja de ser analíticamente optimizable. La desventaja es que se trata de un enfoque de 'minería de datos', es decir, es poco probable que la forma de la deformación anterior sea significativa como explicación de las posibles deformaciones, ya que se basa en un nivel latente no lineal muy alto, artificial y arbitrariamente construido. espacio. Por esta razón, el prior se aprende a partir de datos en lugar de ser creado por un experto humano, como es posible en los modelos basados ​​en resortes.

Comparación con los mapas autoorganizados de Kohonen

Mientras que los nodos en el mapa autoorganizado (SOM) pueden moverse a voluntad, los nodos GTM están limitados por las transformaciones permitidas y sus probabilidades. Si las deformaciones se comportan bien, se conserva la topología del espacio latente.

El SOM fue creado como modelo biológico de neuronas y es un algoritmo heurístico. Por el contrario, el GTM no tiene nada que ver con la neurociencia o la cognición y es un modelo basado en principios probabilísticos. Por tanto, tiene una serie de ventajas sobre SOM, a saber:

GTM fue introducido por Bishop, Svensen y Williams en su Informe Técnico de 1997 (Informe Técnico NCRG/96/015, Universidad de Aston, Reino Unido) publicado posteriormente en Neural Computation. También se describió en la tesis doctoral de Markus Svensen (Aston, 1998).

Aplicaciones

Ver también

Enlaces externos