Algoritmo despierto-sueño

Capas de la red neuronal. R, G son pesos utilizados por el algoritmo de vigilia-sueño para modificar datos dentro de las capas.

El algoritmo de vigilia-sueño ^[1] es un algoritmo de aprendizaje no supervisado para modelos generativos profundos , especialmente máquinas de Helmholtz . ^[2] El algoritmo es similar al algoritmo de maximización de expectativas , ^[3] y optimiza la probabilidad del modelo para los datos observados. ^[4] El nombre del algoritmo deriva del uso de dos fases de aprendizaje, la fase de “vigilia” y la fase de “sueño”, que se realizan alternativamente. ^[1] Puede concebirse como un modelo para el aprendizaje en el cerebro, ^[5] pero también se está aplicando al aprendizaje automático . ^[6]

Descripción

El objetivo del algoritmo de vigilia-sueño es encontrar una representación jerárquica de los datos observados. ^[7] En una representación gráfica del algoritmo, los datos se aplican al algoritmo en la parte inferior, mientras que las capas superiores forman gradualmente representaciones más abstractas. Entre cada par de capas hay dos conjuntos de ponderaciones: ponderaciones de reconocimiento, que definen cómo se infieren las representaciones a partir de los datos, y ponderaciones generativas, que definen cómo estas representaciones se relacionan con los datos. ^[8]

Capacitación

El entrenamiento consta de dos fases: la fase de "vigilia" y la fase de "sueño". Se ha demostrado que este algoritmo de aprendizaje es convergente. ^[3]

La fase de "vigilia"

Las neuronas se activan mediante conexiones de reconocimiento (desde lo que sería entrada hasta lo que sería salida). Las conexiones generativas (que van de las salidas a las entradas) luego se modifican para aumentar la probabilidad de que recreen la actividad correcta en la capa inferior, más cercana a los datos reales de la entrada sensorial. ^[1]

La fase de "sueño"

El proceso se invierte en la fase de "sueño": las neuronas se activan mediante conexiones generativas mientras las conexiones de reconocimiento se modifican para aumentar la probabilidad de que recreen la actividad correcta en la capa superior, según los datos reales de la entrada sensorial. ^[1]

Extensiones

Dado que la red de reconocimiento tiene una flexibilidad limitada, es posible que no pueda aproximarse bien a la distribución posterior de las variables latentes. ^[6] Para aproximarse mejor a la distribución posterior, es posible emplear un muestreo de importancia , con la red de reconocimiento como distribución de propuesta. Esta aproximación mejorada de la distribución posterior también mejora el rendimiento general del modelo. ^[6]

Ver también

Máquina de Boltzmann restringida , un tipo de red neuronal que se entrena con un algoritmo conceptualmente similar.
Máquina de Helmholtz , un modelo de red neuronal entrenado mediante el algoritmo de vigilia-sueño.

Referencias

^ abcd Hinton, Geoffrey E .; Dayán, Pedro ; Frey, Brendan J .; Neal, Radford (26 de mayo de 1995). "El algoritmo de vigilia-sueño para redes neuronales no supervisadas". Ciencia . 268 (5214): 1158-1161. Código Bib : 1995 Ciencia... 268.1158H. doi : 10.1126/ciencia.7761831. PMID 7761831. S2CID 871473.
^ Dayan, Pedro . "Máquinas Helmholtz y aprendizaje durante la vigilia y el sueño" (PDF) . Consultado el 1 de noviembre de 2015 .
^ ab Ikeda, Shiro; Amari, Shun-ichi; Nakahara, Hiroyuki (1998). "Convergencia del algoritmo vigilia-sueño". Avances en los sistemas de procesamiento de información neuronal . 11 . Prensa del MIT.
^ Frey, Brendan J.; Hinton, Geoffrey E.; Dayan, Peter (1 de mayo de 1996). "¿El algoritmo de vigilia-sueño produce buenos estimadores de densidad?" (PDF) . Avances en los sistemas de procesamiento de información neuronal.
^ Katayama, Katsuki; Ando, Masataka; Horiguchi, Tsuyoshi (1 de abril de 2004). "Modelos de áreas MT y MST utilizando algoritmo de vigilia-sueño". Redes neuronales . 17 (3): 339–351. doi :10.1016/j.neunet.2003.07.004. PMID 15037352.
^ abc Bornschein, Jörg; Bengio, Yoshua (10 de junio de 2014). "Despierta-sueño reponderado". arXiv : 1406.2751 [cs.LG].
^ Maei, Hamid Reza (25 de enero de 2007). "Algoritmo de vigilia-sueño para el aprendizaje representacional". Universidad de Montréal . Consultado el 1 de noviembre de 2011 .
^ Neal, Radford M.; Dayan, Peter (24 de noviembre de 1996). "Análisis factorial mediante el aprendizaje de las reglas delta durante la vigilia y el sueño" (PDF) . Universidad de Toronto . Consultado el 1 de noviembre de 2015 .