Aprendizaje competitivo

El aprendizaje competitivo es una forma de aprendizaje no supervisado en redes neuronales artificiales , en el que los nodos compiten por el derecho a responder a un subconjunto de datos de entrada. ^[1]^[2] Una variante del aprendizaje hebbiano , el aprendizaje competitivo funciona aumentando la especialización de cada nodo en la red. Es muy adecuado para encontrar grupos dentro de datos.

Los modelos y algoritmos basados en el principio del aprendizaje competitivo incluyen la cuantificación de vectores y mapas autoorganizados (mapas de Kohonen).

Principio

Hay tres elementos básicos para una regla de aprendizaje competitivo: ^[3]^[4]

Un conjunto de neuronas que son todas iguales excepto por algunos pesos sinápticos distribuidos aleatoriamente y que, por lo tanto, responden de manera diferente a un conjunto determinado de patrones de entrada.
Un límite impuesto a la "fuerza" de cada neurona
Mecanismo que permite a las neuronas competir por el derecho a responder a un subconjunto determinado de entradas, de modo que sólo una neurona de salida (o sólo una neurona por grupo) esté activa (es decir, "encendida") a la vez. La neurona que gana la competencia se llama neurona "el ganador se lo lleva todo" .

En consecuencia, las neuronas individuales de la red aprenden a especializarse en conjuntos de patrones similares y, al hacerlo, se convierten en "detectores de características" para diferentes clases de patrones de entrada.

El hecho de que las redes competitivas recodifican conjuntos de entradas correlacionadas en una de unas pocas neuronas de salida esencialmente elimina la redundancia en la representación, que es una parte esencial del procesamiento en los sistemas sensoriales biológicos . ^[5]^[6]

Arquitectura e implementación

El aprendizaje competitivo generalmente se implementa con redes neuronales que contienen una capa oculta que comúnmente se conoce como “capa competitiva”. ^[7] Cada neurona competitiva se describe mediante un vector de pesos y calcula la medida de similitud entre los datos de entrada y el vector de pesos . ${\mathbf {w} }_{i}=\left({w_{i1},..,w_{id}}\right)^{T},i=1,..,M$ ${\mathbf {x} }^{n}=\left({x_{n1},..,x_{nd}}\right)^{T}\in \mathbb {R} ^{d}$ ${\mathbf {w} }_{i}$

Para cada vector de entrada, las neuronas competitivas "compiten" entre sí para ver cuál de ellas es más similar a ese vector de entrada en particular. La neurona ganadora m establece su salida y todas las demás neuronas competitivas establecen su salida . $o_{m}=1$ $o_{i}=0,i=1,..,M,i\neq m$

Habitualmente, para medir la similitud se utiliza la inversa de la distancia euclidiana: entre el vector de entrada y el vector de peso . $\left\|{{\mathbf {x} }-{\mathbf {w} }_{i}}\right\|$ ${\mathbf {x} }^{n}$ ${\mathbf {w} }_{i}$

Algoritmo de ejemplo

A continuación se muestra un algoritmo de aprendizaje competitivo simple para encontrar tres grupos dentro de algunos datos de entrada.

1. (Configuración). Deje que un conjunto de sensores se alimente a tres nodos diferentes, de modo que cada nodo esté conectado a cada sensor. Deje que los pesos que cada nodo asigna a sus sensores se establezcan aleatoriamente entre 0,0 y 1,0. Sea la salida de cada nodo la suma de todos sus sensores, multiplicando la intensidad de la señal de cada sensor por su peso.

2. Cuando se muestra una entrada a la red, el nodo con el mayor rendimiento se considera ganador. La entrada se clasifica como dentro del clúster correspondiente a ese nodo.

3. El ganador actualiza cada uno de sus pesos, moviendo el peso de las conexiones que le dieron señales más débiles a las conexiones que le dieron señales más fuertes.

Por lo tanto, a medida que se reciben más datos, cada nodo converge en el centro del grupo que ha llegado a representar y se activa con más fuerza para las entradas de este grupo y más débilmente para las entradas de otros grupos.

Ver también

Referencias

^ Rumelhart, David ; David Zipser; James L. McClelland; et al. (1986). Procesamiento distribuido paralelo, vol. 1 . Prensa del MIT. págs. 151-193.
^ Grossberg, Stephen (1 de enero de 1987). "Aprendizaje competitivo: de la activación interactiva a la resonancia adaptativa" (PDF) . Ciencia cognitiva . 11 (1): 23–63. doi : 10.1016/S0364-0213(87)80025-3 . ISSN 0364-0213.
^ Rumelhart, David E. y David Zipser. "Descubrimiento de funciones mediante el aprendizaje competitivo". Ciencia cognitiva 9.1 (1985): 75-112.
^ Haykin, Simon, "Red neuronal. Una base integral". Redes neuronales 2.2004 (2004).
^ Barlow, Horace B. "Aprendizaje no supervisado". Computación neuronal 1.3 (1989): 295-311.
^ Edmund T. Rolls y Gustavo Deco. Neurociencia computacional de la visión. Oxford: prensa de la Universidad de Oxford, 2002.
^ Salatas, John (24 de agosto de 2011). "Implementación de Redes de Aprendizaje Competitivo para WEKA". Blog de investigación en TIC . Consultado el 28 de enero de 2012 .

Más información y software

Borrador del informe "Algunos métodos de aprendizaje competitivos" (contiene descripciones de varios algoritmos relacionados)
DemoGNG - Simulador Java para métodos de aprendizaje competitivos