stringtranslate.com

Teoría de la resonancia adaptativa

La teoría de la resonancia adaptativa ( ART ) es una teoría desarrollada por Stephen Grossberg y Gail Carpenter sobre aspectos de cómo el cerebro procesa la información . Describe una serie de modelos de redes neuronales artificiales que utilizan métodos de aprendizaje supervisados ​​y no supervisados ​​y abordan problemas como el reconocimiento y la predicción de patrones.

La intuición principal detrás del modelo ART es que la identificación y el reconocimiento de objetos generalmente ocurren como resultado de la interacción de las expectativas del observador "de arriba hacia abajo" con la información sensorial "de abajo hacia arriba" . El modelo postula que las expectativas "de arriba hacia abajo" toman la forma de una plantilla de memoria o prototipo que luego se compara con las características reales de un objeto detectadas por los sentidos. Esta comparación da lugar a una medida de pertenencia a una categoría. Siempre que esta diferencia entre sensación y expectativa no exceda un umbral establecido llamado "parámetro de vigilancia", el objeto detectado se considerará miembro de la clase esperada. El sistema ofrece así una solución al problema de la "plasticidad/estabilidad", es decir, el problema de adquirir nuevos conocimientos sin alterar los conocimientos existentes, lo que también se denomina aprendizaje incremental .

Modelo de aprendizaje

Estructura básica de ARTE

El sistema ART básico es un modelo de aprendizaje no supervisado . Normalmente consta de un campo de comparación y un campo de reconocimiento compuesto por neuronas , un parámetro de vigilancia (umbral de reconocimiento) y un módulo de reinicio .

Capacitación

Existen dos métodos básicos para entrenar redes neuronales basadas en ART: lento y rápido. En el método de aprendizaje lento, el grado de entrenamiento de los pesos de la neurona de reconocimiento hacia el vector de entrada se calcula en valores continuos con ecuaciones diferenciales y, por lo tanto, depende del período de tiempo que se presenta el vector de entrada. Con un aprendizaje rápido, se utilizan ecuaciones algebraicas para calcular el grado de ajustes de peso que se deben realizar y se utilizan valores binarios. Si bien el aprendizaje rápido es efectivo y eficiente para una variedad de tareas, el método de aprendizaje lento es biológicamente más plausible y puede usarse con redes de tiempo continuo (es decir, cuando el vector de entrada puede variar continuamente).

Tipos

ART 1 [1] [2] es la variedad más simple de redes ART y acepta solo entradas binarias. ART 2 [3] amplía las capacidades de la red para admitir entradas continuas. ART 2-A [4] es una forma simplificada de ART-2 con un tiempo de ejecución drásticamente acelerado y con resultados cualitativos que rara vez son inferiores a la implementación completa de ART-2. ART 3 [5] se basa en ART-2 al simular la regulación rudimentaria de neurotransmisores de la actividad sináptica mediante la incorporación de concentraciones simuladas de iones de sodio (Na+) y calcio (Ca2+) en las ecuaciones del sistema, lo que resulta en un medio fisiológicamente más realista de inhibir parcialmente categorías que desencadenar restablecimientos de discrepancia.

Descripción general de ARTMAP

ARTMAP [6], también conocido como ART predictivo , combina dos unidades ART-1 o ART-2 ligeramente modificadas en una estructura de aprendizaje supervisado donde la primera unidad toma los datos de entrada y la segunda unidad toma los datos de salida correctos, luego se usa para hacer el Ajuste mínimo posible del parámetro de vigilancia en la primera unidad para realizar la clasificación correcta.

Fuzzy ART [7] implementa lógica difusa en el reconocimiento de patrones de ART, mejorando así la generalización. Una característica opcional (y muy útil) del ART difuso es la codificación complementaria, un medio para incorporar la ausencia de características en las clasificaciones de patrones, lo que contribuye en gran medida a prevenir la proliferación de categorías ineficiente e innecesaria. Las medidas de similitud aplicadas se basan en la norma L1 . Se sabe que Fuzzy ART es muy sensible al ruido.

Fuzzy ARTMAP [8] es simplemente ARTMAP que utiliza unidades ART difusas, lo que da como resultado un aumento correspondiente en la eficacia.

Simplified Fuzzy ARTMAP (SFAM) [9] constituye una variante fuertemente simplificada de difusa ARTMAP dedicada a tareas de clasificación .

ART gaussiano [10] y ARTMAP gaussiano [10] utilizan funciones de activación gaussianas y cálculos basados ​​en la teoría de la probabilidad. Por tanto, tienen cierta similitud con los modelos de mezcla gaussiana . En comparación con el ART difuso y el ARTMAP difuso, son menos sensibles al ruido. Pero la estabilidad de las representaciones aprendidas se reduce, lo que puede conducir a una proliferación de categorías en tareas de aprendizaje abiertas.

Fusion ART y redes relacionadas [11] [12] [13] extienden ART y ARTMAP a múltiples canales de patrones. Apoyan varios paradigmas de aprendizaje, incluido el aprendizaje no supervisado, el aprendizaje supervisado y el aprendizaje por refuerzo.

TopoART [14] combina ART difuso con redes de aprendizaje de topología como el gas neuronal en crecimiento . Además, añade un mecanismo de reducción de ruido. Existen varias redes neuronales derivadas que extienden TopoART a paradigmas de aprendizaje adicionales.

Hypersphere ART [15] y Hypersphere ARTMAP [15] están estrechamente relacionados con ART difuso y ARTMAP difuso, respectivamente. Pero como utilizan un tipo diferente de representación de categorías (es decir, hiperesferas), no requieren que su entrada esté normalizada al intervalo [0, 1]. Aplican medidas de similitud basadas en la norma L2 .

LAPART [16] Las redes neuronales de la teoría de resonancia adaptativa con cebado lateral (LAPART) combinan dos algoritmos Fuzzy ART para crear un mecanismo para hacer predicciones basadas en asociaciones aprendidas. El acoplamiento de los dos Fuzzy ART tiene una estabilidad única que permite que el sistema converja rápidamente hacia una solución clara. Además, puede realizar inferencias lógicas y aprendizaje supervisado similar al ARTMAP difuso.

Crítica

Se ha observado que los resultados de Fuzzy ART y ART 1 (es decir, las categorías aprendidas) dependen críticamente del orden en que se procesan los datos de entrenamiento. El efecto se puede reducir hasta cierto punto utilizando una tasa de aprendizaje más lenta, pero está presente independientemente del tamaño del conjunto de datos de entrada. Por lo tanto, las estimaciones difusas de ART y ART 1 no poseen la propiedad estadística de coherencia . [17] Este problema puede considerarse como un efecto secundario de los respectivos mecanismos que garantizan el aprendizaje estable en ambas redes.

Las redes ART más avanzadas, como TopoART e Hypersphere TopoART, que resumen categorías en grupos, pueden resolver este problema ya que las formas de los grupos no dependen del orden de creación de las categorías asociadas. (cf. Fig. 3(g, h) y Fig. 4 de [18] )

Referencias

  1. ^ Carpenter, GA y Grossberg, S. (2003), Teoría de la resonancia adaptativa Archivado el 19 de mayo de 2006 en Wayback Machine , en Michael A. Arbib (Ed.), The Handbook of Brain Theory and Neural Networks, segunda edición (págs. 87-90). Cambridge, MA: Prensa del MIT
  2. ^ Grossberg, S. (1987), Aprendizaje competitivo: de la activación interactiva a la resonancia adaptativa Archivado el 7 de septiembre de 2006 en Wayback Machine , Cognitive Science (revista) , 11, 23-63
  3. ^ Carpenter, GA y Grossberg, S. (1987), ARTE 2: Autoorganización de códigos de reconocimiento de categorías estables para patrones de entrada analógica Archivado el 4 de septiembre de 2006 en Wayback Machine , Applied Optics , 26(23), 4919-4930
  4. ^ Carpenter, GA, Grossberg, S. y Rosen, DB (1991a), ART 2-A: Un algoritmo de resonancia adaptativo para el aprendizaje y reconocimiento rápido de categorías Archivado el 19 de mayo de 2006 en Wayback Machine , Neural Networks , 4, 493 -504
  5. ^ Carpenter, GA y Grossberg, S. (1990), ARTE 3: Búsqueda jerárquica utilizando transmisores químicos en arquitecturas de reconocimiento de patrones autoorganizadas Archivado el 6 de septiembre de 2006 en Wayback Machine , Neural Networks , 3, 129-152
  6. ^ Carpenter, GA, Grossberg, S. y Reynolds, JH (1991), ARTMAP: aprendizaje supervisado en tiempo real y clasificación de datos no estacionarios mediante una red neuronal autoorganizada Archivado el 19 de mayo de 2006 en Wayback Machine , Redes neuronales , 4, 565-588
  7. ^ Carpenter, GA, Grossberg, S. y Rosen, DB (1991b), Fuzzy ART: aprendizaje rápido y estable y categorización de patrones analógicos mediante un sistema de resonancia adaptativo Archivado el 19 de mayo de 2006 en Wayback Machine , Neural Networks , 4, 759-771
  8. ^ Carpenter, GA, Grossberg, S., Markuzon, N., Reynolds, JH y Rosen, DB (1992), Fuzzy ARTMAP: una arquitectura de red neuronal para el aprendizaje incremental supervisado de mapas multidimensionales analógicos Archivado el 19 de mayo de 2006 en Wayback Machine , Transacciones IEEE en redes neuronales , 3, 698-713
  9. ^ Mohammad-Taghi Vakil-Baghmisheh y Nikola Pavešić. (2003) Una red ARTMAP difusa rápida y simplificada, Cartas de procesamiento neuronal, 17 (3): 273–316
  10. ^ ab James R. Williamson. (1996), ARTMAP gaussiano: una red neuronal para el aprendizaje incremental rápido de mapas multidimensionales ruidosos, Neural Networks, 9(5):881-897
  11. ^ YR Asfour, GA Carpenter, S. Grossberg y GW Lesher. (1993) Fusion ARTMAP: una red difusa adaptativa para clasificación multicanal. En: Actas de la Tercera Conferencia Internacional sobre Sistemas Inteligentes y Control Difuso Industrial (IFIS).
  12. ^ Bronceado, A.-H.; Carpintero, Georgia; Grossberg, S. (2007). "Inteligencia a través de la interacción: hacia una teoría unificada del aprendizaje". En Liu, D.; Fei, S.; Hou, Z.-G.; Zhang, H.; Sol, C. (eds.). Avances en redes neuronales – ISNN 2007 . Apuntes de conferencias sobre informática. vol. 4491. Berlín, Heidelberg: Springer. págs. 1094-1103. doi :10.1007/978-3-540-72383-7_128. ISBN 978-3-540-72383-7.
  13. ^ Bronceado, A.-H.; Subagdja, B.; Wang, D.; Meng, L. (2019). "Redes neuronales autoorganizadas para aprendizaje universal y codificación de memoria multimodal". Redes neuronales . 120 : 58–73. doi :10.1016/j.neunet.2019.08.020. PMID  31537437. S2CID  202703163.
  14. ^ Marko Tscherepanow. (2010) TopoART: una red ART jerárquica de aprendizaje de topología, en: Actas de la Conferencia internacional sobre redes neuronales artificiales (ICANN), Parte III, LNCS 6354, 157-167
  15. ^ ab Georgios C. Anagnostopoulos y Michael Georgiopoulos. (2000), Hypersphere ART y ARTMAP para el aprendizaje incremental supervisado y no supervisado, en: Actas de la Conferencia Internacional Conjunta sobre Redes Neuronales (IJCNN), vol. 6, 59-64
  16. ^ Laboratorios Nacionales Sandia (2017) Documentación de Lapart-python
  17. ^ Sarle, Warren S. (1995), Por qué los estadísticos no deberían tirarse pedos Archivado el 20 de julio de 2011 en Wayback Machine .
  18. ^ Marko Tscherepanow. (2012) Agrupación incremental en línea con una red neuronal ART jerárquica de aprendizaje de topología utilizando categorías hiperesféricas, en: Póster y actas industriales de la Conferencia industrial sobre minería de datos (ICDM), 22–34

Wasserman, Philip D. (1989), Computación neuronal: teoría y práctica, Nueva York: Van Nostrand Reinhold, ISBN 0-442-20743-3 

enlaces externos