stringtranslate.com

Algoritmo de vigilia y sueño

Capas de la red neuronal. R, G son pesos utilizados por el algoritmo de vigilia-sueño para modificar los datos dentro de las capas.

El algoritmo de vigilia-sueño [1] es un algoritmo de aprendizaje no supervisado para modelos generativos profundos , especialmente máquinas de Helmholtz . [2] El algoritmo es similar al algoritmo de maximización de expectativas [ 3] y optimiza la probabilidad del modelo para los datos observados. [4] El nombre del algoritmo deriva de su uso de dos fases de aprendizaje, la fase de "vigilia" y la fase de "sueño", que se realizan de forma alternada. [1] Puede concebirse como un modelo para el aprendizaje en el cerebro, [5] pero también se está aplicando para el aprendizaje automático . [6]

Descripción

El objetivo del algoritmo de vigilia-sueño es encontrar una representación jerárquica de los datos observados. [7] En una representación gráfica del algoritmo, los datos se aplican al algoritmo en la parte inferior, mientras que las capas superiores forman representaciones gradualmente más abstractas. Entre cada par de capas hay dos conjuntos de pesos: pesos de reconocimiento, que definen cómo se infieren las representaciones a partir de los datos, y pesos generativos, que definen cómo se relacionan estas representaciones con los datos. [8]

Capacitación

El entrenamiento consta de dos fases: la fase de “vigilia” y la fase de “sueño”. Se ha demostrado que este algoritmo de aprendizaje es convergente. [3]

La fase de "vigilia"

Las neuronas se activan mediante conexiones de reconocimiento (de lo que sería una entrada a lo que sería una salida). Las conexiones generativas (que van de las salidas a las entradas) se modifican para aumentar la probabilidad de que vuelvan a crear la actividad correcta en la capa inferior, más cercana a los datos reales de la entrada sensorial. [1]

La fase de "sueño"

El proceso se invierte en la fase de “sueño”: las neuronas son activadas por conexiones generativas mientras que las conexiones de reconocimiento se modifican para aumentar la probabilidad de que vuelvan a crear la actividad correcta en la capa superior, en función de los datos reales de la entrada sensorial. [1]

Extensiones

Dado que la red de reconocimiento tiene una flexibilidad limitada, es posible que no pueda aproximarse bien a la distribución posterior de las variables latentes. [6] Para aproximarse mejor a la distribución posterior, es posible emplear un muestreo de importancia , con la red de reconocimiento como distribución propuesta. Esta aproximación mejorada de la distribución posterior también mejora el rendimiento general del modelo. [6]

Véase también

Referencias

  1. ^ abcd Hinton, Geoffrey E. ; Dayan, Peter ; Frey, Brendan J. ; Neal, Radford (26 de mayo de 1995). "El algoritmo de vigilia-sueño para redes neuronales no supervisadas". Science . 268 (5214): 1158–1161. Bibcode :1995Sci...268.1158H. doi :10.1126/science.7761831. PMID  7761831. S2CID  871473.
  2. ^ Dayan, Peter . "Máquinas de Helmholtz y aprendizaje durante el sueño y la vigilia" (PDF) . Consultado el 1 de noviembre de 2015 .
  3. ^ ab Ikeda, Shiro; Amari, Shun-ichi; Nakahara, Hiroyuki (1998). "Convergencia del algoritmo de vigilia-sueño". Avances en sistemas de procesamiento de información neuronal . 11 . MIT Press.
  4. ^ Frey, Brendan J.; Hinton, Geoffrey E.; Dayan, Peter (1 de mayo de 1996). "¿El algoritmo de vigilia-sueño produce buenos estimadores de densidad?" (PDF) . Avances en sistemas de procesamiento de información neuronal.
  5. ^ Katayama, Katsuki; Ando, ​​Masataka; Horiguchi, Tsuyoshi (1 de abril de 2004). "Modelos de áreas MT y MST utilizando algoritmo de vigilia-sueño". Redes Neuronales . 17 (3): 339–351. doi :10.1016/j.neunet.2003.07.004. PMID  15037352.
  6. ^ abc Bornschein, Jörg; Bengio, Yoshua (10 de junio de 2014). "Vigilancia-sueño reponderados". arXiv : 1406.2751 [cs.LG].
  7. ^ Maei, Hamid Reza (25 de enero de 2007). "Algoritmo de vigilia y sueño para el aprendizaje representacional". Universidad de Montreal . Consultado el 1 de noviembre de 2011 .
  8. ^ Neal, Radford M.; Dayan, Peter (24 de noviembre de 1996). "Análisis factorial mediante el aprendizaje de las reglas delta durante el sueño y la vigilia" (PDF) . Universidad de Toronto . Consultado el 1 de noviembre de 2015 .