La teoría hebbiana es una teoría neuropsicológica que sostiene que el aumento de la eficacia sináptica surge de la estimulación repetida y persistente de una célula presináptica a una célula postsináptica. Es un intento de explicar la plasticidad sináptica , la adaptación de las neuronas cerebrales durante el proceso de aprendizaje. Fue introducida por Donald Hebb en su libro de 1949 La organización de la conducta . [1] La teoría también se denomina regla de Hebb , postulado de Hebb y teoría del ensamblaje celular . Hebb la enuncia de la siguiente manera:
Supongamos que la persistencia o repetición de una actividad reverberante (o "rastro") tiende a inducir cambios celulares duraderos que aumentan su estabilidad. ... Cuando un axón de la célula A está lo suficientemente cerca como para excitar a una célula B y participa repetida o persistentemente en su activación, se produce algún proceso de crecimiento o cambio metabólico en una o ambas células de modo que aumenta la eficiencia de A , como una de las células que activa a B. [1] : 62
La teoría se suele resumir como " Las neuronas que se activan juntas, se conectan entre sí ". [2] Sin embargo, Hebb enfatizó que la célula A necesita "participar en la activación" de la célula B , y tal causalidad puede ocurrir solo si la célula A se activa justo antes, no al mismo tiempo que, la célula B. Este aspecto de la causalidad en el trabajo de Hebb prefiguró lo que ahora se sabe sobre la plasticidad dependiente del tiempo de pico , que requiere precedencia temporal. [3]
La teoría intenta explicar el aprendizaje asociativo o hebbiano , en el que la activación simultánea de células conduce a aumentos pronunciados en la fuerza sináptica entre esas células. También proporciona una base biológica para los métodos de aprendizaje sin errores para la educación y la rehabilitación de la memoria. En el estudio de las redes neuronales en la función cognitiva, a menudo se considera como la base neuronal del aprendizaje no supervisado .
La teoría de Hebb trata de cómo las neuronas pueden conectarse entre sí para convertirse en engramas . Las teorías de Hebb sobre la forma y la función de los conjuntos celulares se pueden entender a partir de lo siguiente: [1] : 70
La idea general es antigua: dos células o sistemas de células que estén activos repetidamente al mismo tiempo tenderán a "asociarse", de modo que la actividad de una facilita la actividad de la otra.
Hebb también escribió: [1] : 63
Cuando una célula ayuda repetidamente a activar a otra, el axón de la primera célula desarrolla protuberancias sinápticas (o las agranda si ya existen) en contacto con el soma de la segunda célula.
[D. Alan Allport] propone ideas adicionales sobre la teoría del ensamblaje celular y su papel en la formación de engramas, en la línea del concepto de autoasociación, descrito de la siguiente manera:
Si las entradas de un sistema hacen que el mismo patrón de actividad se repita, el conjunto de elementos activos que constituyen ese patrón se asociará entre sí cada vez más fuertemente. Es decir, cada elemento tenderá a activar a todos los demás elementos y (con pesos negativos) a desactivar a los elementos que no forman parte del patrón. Dicho de otro modo, el patrón en su conjunto se "autoasociará". Podemos llamar engrama a un patrón aprendido (autoasociado). [4] : 44
El trabajo en el laboratorio de Eric Kandel ha proporcionado evidencia de la participación de los mecanismos de aprendizaje hebbianos en las sinapsis del gasterópodo marino Aplysia californica . [ cita requerida ] Los experimentos sobre los mecanismos de modificación de sinapsis hebbianos en las sinapsis del sistema nervioso central de los vertebrados son mucho más difíciles de controlar que los experimentos con las sinapsis relativamente simples del sistema nervioso periférico estudiadas en invertebrados marinos. Gran parte del trabajo sobre cambios sinápticos duraderos entre neuronas de vertebrados (como la potenciación a largo plazo ) implica el uso de estimulación experimental no fisiológica de las células cerebrales. Sin embargo, algunos de los mecanismos de modificación de sinapsis fisiológicamente relevantes que se han estudiado en cerebros de vertebrados parecen ser ejemplos de procesos hebbianos. Uno de esos estudios [5] revisa los resultados de experimentos que indican que los cambios duraderos en las fortalezas sinápticas pueden ser inducidos por la actividad sináptica fisiológicamente relevante que funciona a través de mecanismos hebbianos y no hebbianos.
Desde el punto de vista de las neuronas artificiales y las redes neuronales artificiales , el principio de Hebb puede describirse como un método para determinar cómo alterar los pesos entre neuronas modelo. El peso entre dos neuronas aumenta si las dos neuronas se activan simultáneamente y se reduce si se activan por separado. Los nodos que tienden a ser ambos positivos o ambos negativos al mismo tiempo tienen pesos positivos fuertes, mientras que aquellos que tienden a ser opuestos tienen pesos negativos fuertes.
La siguiente es una descripción formulaica del aprendizaje hebbiano: (son posibles muchas otras descripciones)
donde es el peso de la conexión de neurona a neurona y la entrada para neurona . Tenga en cuenta que esto es aprendizaje de patrones (pesos actualizados después de cada ejemplo de entrenamiento). En una red de Hopfield , las conexiones se establecen en cero si (no se permiten conexiones reflexivas). Con neuronas binarias (activaciones 0 o 1), las conexiones se establecerían en 1 si las neuronas conectadas tienen la misma activación para un patrón.
Cuando se utilizan varios patrones de entrenamiento la expresión se convierte en un promedio de los individuales:
donde es el peso de la conexión de neurona a neurona , es el número de patrones de entrenamiento y la entrada -ésima para neurona . Esto es aprendizaje por época (pesos actualizados después de que se presentan todos los ejemplos de entrenamiento), siendo el último término aplicable tanto a conjuntos de entrenamiento discretos como continuos. Nuevamente, en una red de Hopfield, las conexiones se establecen en cero si (no hay conexiones reflexivas).
Una variación del aprendizaje hebbiano que tiene en cuenta fenómenos como el bloqueo y muchos otros fenómenos de aprendizaje neuronal es el modelo matemático de Harry Klopf. [6] El modelo de Klopf reproduce una gran cantidad de fenómenos biológicos y también es fácil de implementar.
Debido a la naturaleza simple del aprendizaje hebbiano, basado únicamente en la coincidencia de la actividad presináptica y postsináptica, puede que no resulte intuitivamente claro por qué esta forma de plasticidad conduce a un aprendizaje significativo. Sin embargo, se puede demostrar que la plasticidad hebbiana capta las propiedades estadísticas de la información de una manera que puede categorizarse como aprendizaje no supervisado.
Esto se puede demostrar matemáticamente con un ejemplo simplificado. Trabajemos bajo el supuesto simplificador de una única neurona basada en la tasa de tasa , cuyas entradas tienen tasas . La respuesta de la neurona se describe generalmente como una combinación lineal de su entrada, , seguida de una función de respuesta :
Como se definió en las secciones anteriores, la plasticidad hebbiana describe la evolución en el tiempo del peso sináptico :
Suponiendo, para simplificar, una función de respuesta de identidad , podemos escribir
o en forma matricial :
Al igual que en el capítulo anterior, si se realiza un entrenamiento por época, se puede realizar un promedio sobre un conjunto de entrenamiento discreto o continuo (tiempo) de : donde es la matriz de correlación de la entrada bajo el supuesto adicional de que (es decir, el promedio de las entradas es cero). Este es un sistema de ecuaciones diferenciales lineales acopladas. Dado que es simétrico , también es diagonalizable y se puede encontrar que la solución, trabajando en su base de vectores propios, tiene la forma
donde son constantes arbitrarias, son los vectores propios de y sus valores propios correspondientes. Dado que una matriz de correlación es siempre una matriz definida positiva , los valores propios son todos positivos, y uno puede ver fácilmente cómo la solución anterior es siempre exponencialmente divergente en el tiempo. Este es un problema intrínseco debido a que esta versión de la regla de Hebb es inestable, ya que en cualquier red con una señal dominante los pesos sinápticos aumentarán o disminuirán exponencialmente. Intuitivamente, esto se debe a que siempre que la neurona presináptica excita a la neurona postsináptica, el peso entre ellas se refuerza, lo que provoca una excitación aún más fuerte en el futuro, y así sucesivamente, de forma autorreforzante. Uno puede pensar que una solución es limitar la tasa de disparo de la neurona postsináptica añadiendo una función de respuesta de saturación no lineal , pero de hecho, se puede demostrar que para cualquier modelo de neurona, la regla de Hebb es inestable. [7] Por lo tanto, los modelos de redes de neuronas suelen emplear otras teorías de aprendizaje como la teoría BCM , la regla de Oja , [8] o el algoritmo hebbiano generalizado .
De todos modos, incluso para la solución inestable anterior, se puede ver que, cuando ha transcurrido suficiente tiempo, uno de los términos domina sobre los demás, y
donde es el valor propio más grande de . En este momento, la neurona postsináptica realiza la siguiente operación:
Porque, de nuevo, el vector propio corresponde al mayor valor propio de la matriz de correlación entre los s, esto corresponde exactamente al cálculo del primer componente principal de la entrada.
Este mecanismo se puede extender para realizar un PCA (análisis de componentes principales) completo de la entrada añadiendo más neuronas postsinápticas, siempre que se evite que todas ellas capten el mismo componente principal, por ejemplo añadiendo inhibición lateral en la capa postsináptica. De este modo, hemos conectado el aprendizaje hebbiano con el PCA, que es una forma elemental de aprendizaje no supervisado, en el sentido de que la red puede captar aspectos estadísticos útiles de la entrada y "describirlos" de forma destilada en su salida. [9]
A pesar del uso común de los modelos hebbianos para la potenciación a largo plazo, el principio de Hebb no cubre todas las formas de plasticidad sináptica a largo plazo. Hebb no postuló ninguna regla para las sinapsis inhibitorias, ni hizo predicciones para secuencias de picos anticausales (la neurona presináptica se activa después de la neurona postsináptica). La modificación sináptica puede no ocurrir simplemente solo entre las neuronas activadas A y B, sino también en sinapsis vecinas. [10] Por lo tanto, todas las formas de plasticidad heterosináptica y homeostática se consideran no hebbianas. Un ejemplo es la señalización retrógrada a las terminales presinápticas. [11] El compuesto más comúnmente identificado como el que cumple esta función de transmisor retrógrado es el óxido nítrico , que, debido a su alta solubilidad y difusividad, a menudo ejerce efectos sobre las neuronas cercanas. [12] Este tipo de modificación sináptica difusa, conocida como aprendizaje de volumen, no está incluida en el modelo hebbiano tradicional. [13]
El aprendizaje hebbiano y la plasticidad dependiente del momento de los picos se han utilizado en una influyente teoría sobre cómo surgen las neuronas espejo . [14] [15] Las neuronas espejo son neuronas que se activan tanto cuando un individuo realiza una acción como cuando ve [16] u oye [17] a otro realizar una acción similar. El descubrimiento de estas neuronas ha sido muy influyente para explicar cómo los individuos dan sentido a las acciones de los demás, al mostrar que, cuando una persona percibe las acciones de los demás, activa los programas motores que utilizaría para realizar acciones similares. La activación de estos programas motores agrega información a la percepción y ayuda a predecir lo que la persona hará a continuación según el propio programa motor del perceptor. Un desafío ha sido explicar cómo los individuos llegan a tener neuronas que responden tanto mientras realizan una acción como cuando escuchan o ven a otro realizar acciones similares.
Christian Keysers y David Perrett sugirieron que cuando un individuo realiza una acción particular, verá, oirá y sentirá la ejecución de la acción. Estas señales sensoriales re-aferentes desencadenarán la actividad en las neuronas que responden a la vista, el sonido y la sensación de la acción. Debido a que la actividad de estas neuronas sensoriales se superpondrá constantemente en el tiempo con las de las neuronas motoras que causaron la acción, el aprendizaje hebbiano predice que las sinapsis que conectan las neuronas que responden a la vista, el sonido y la sensación de una acción y las de las neuronas que desencadenan la acción deberían potenciarse. Lo mismo sucede cuando las personas se miran al espejo, se escuchan balbucear o son imitadas por otros. Después de la experiencia repetida de esta re-aferencia, las sinapsis que conectan las representaciones sensoriales y motoras de una acción son tan fuertes que las neuronas motoras comienzan a activarse ante el sonido o la visión de la acción, y se crea una neurona espejo.
La evidencia de esa perspectiva proviene de muchos experimentos que muestran que los programas motores pueden ser activados por nuevos estímulos auditivos o visuales después del emparejamiento repetido del estímulo con la ejecución del programa motor (para una revisión de la evidencia, consulte Giudice et al., 2009 [18] ). Por ejemplo, las personas que nunca han tocado el piano no activan las regiones cerebrales involucradas en tocar el piano cuando escuchan música de piano. Se ha demostrado que cinco horas de lecciones de piano, en las que el participante está expuesto al sonido del piano cada vez que presiona una tecla, son suficientes para desencadenar la actividad en las regiones motoras del cerebro al escuchar música de piano cuando se escucha en un momento posterior. [19] En consonancia con el hecho de que la plasticidad dependiente del tiempo de pico ocurre solo si el disparo de la neurona presináptica predice el disparo de la neurona postsináptica, [20] el vínculo entre los estímulos sensoriales y los programas motores también solo parece potenciarse si el estímulo es contingente al programa motor.
{{cite book}}
: |work=
ignorado ( ayuda )