Modelo Rescorla-Wagner

El modelo Rescorla-Wagner (" RW ") es un modelo de condicionamiento clásico , en el que el aprendizaje se conceptualiza en términos de asociaciones entre estímulos condicionados (CS) e incondicionados (US). Una fuerte asociación CS-EE.UU. significa que las señales de CS predicen los EE.UU. Se podría decir que antes del condicionamiento, el sujeto es sorprendido por los EE.UU., pero después del condicionamiento, el sujeto ya no se sorprende, porque el CS predice la llegada de los EE.UU. El modelo divide los procesos de condicionamiento en pruebas discretas, durante las cuales los estímulos pueden estar presentes o ausentes. La fuerza de predicción de los EE. UU. en un ensayo se puede representar como la suma de las fuerzas asociativas de todos los CS presentes durante el ensayo. Esta característica del modelo representó un avance importante con respecto a los modelos anteriores y permitió una explicación sencilla de importantes fenómenos experimentales, en particular el efecto de bloqueo . Los fallos del modelo han dado lugar a modificaciones, modelos alternativos y muchos hallazgos adicionales. El modelo ha tenido cierto impacto en la ciencia neuronal en los últimos años, ya que los estudios han sugerido que la actividad fásica de las neuronas dopaminérgicas en las proyecciones DA mesoestriatales en el mesencéfalo codifica el tipo de error de predicción detallado en el modelo. ^[1]

El modelo Rescorla-Wagner fue creado por los psicólogos de Yale Robert A. Rescorla y Allan R. Wagner en 1972.

Supuestos básicos del modelo.

El cambio en la asociación entre un CS y un EE.UU. que se produce cuando los dos están emparejados depende de cuán fuertemente se predice el EE.UU. en ese ensayo; es decir, informalmente, qué tan "sorprendido" está el organismo por el EE.UU. La cantidad de esta "sorpresa" depende de la fuerza asociativa sumada de todas las señales presentes durante esa prueba. Por el contrario, los modelos anteriores derivaban el cambio en la fuerza asociativa únicamente del valor actual del CS.
La fuerza asociativa de un CS está representada por un único número. La asociación es excitadora si el número es positivo, inhibidora si es negativo.
La fuerza asociativa de un estímulo se expresa directamente por la conducta que provoca/inhibe.
La prominencia de un CS (alfa en la ecuación) y la fuerza del US (beta) son constantes y no cambian durante el entrenamiento.
Sólo la fuerza asociativa actual de una señal determina su efecto sobre la conducta y la cantidad de aprendizaje que apoya. No importa cómo se llegó a ese valor de fuerza, ya sea por simple condicionamiento, reacondicionamiento o de otra manera.

Los dos primeros supuestos eran nuevos en el modelo de Rescorla-Wagner. Los últimos tres supuestos estaban presentes en modelos anteriores y son menos cruciales para las nuevas predicciones del modelo RW.

Ecuación

\Delta V_{X}^{n+1}=\alpha _{X}\beta (\lambda -V_{\mathrm {tot} })

V_{X}^{n+1}=V_{X}^{n}+\Delta V_{X}^{n+1}

dónde

$\Delta V_{X}$ es el cambio en la fuerza, en un solo ensayo, de la asociación entre el CS etiquetado como "X" y el EE.UU.
$\alpha$ es la prominencia de X (limitada por 0 y 1)
${\displaystyle\beta}$ es el parámetro de tasa para EE. UU. (limitado por 0 y 1), a veces llamado valor de asociación
${\displaystyle\lambda}$ es el máximo condicionamiento posible para EE.UU.
$V_{X}$ es la fuerza asociativa actual de X
$V_{\mathrm {tot} }$ es la fuerza asociativa total de todos los estímulos presentes, es decir, X más cualquier otro

^[2]

El modelo RW revisado por Van Hamme y Wasserman (1994)

Van Hamme y Wasserman ampliaron el modelo original de Rescorla-Wagner (RW) e introdujeron un nuevo factor en su modelo RW revisado en 1994: ^[3] Sugirieron que no sólo los estímulos condicionados físicamente presentes en una prueba determinada pueden sufrir cambios en su capacidad asociativa. fuerza, el valor asociativo de un CS también puede verse alterado por una asociación dentro del compuesto con un CS presente en esa prueba. Se establece una asociación dentro del compuesto si dos CS se presentan juntos durante el entrenamiento (estímulo compuesto). Si uno de los dos CS componentes se presenta posteriormente solo, se supone que también activa una representación del otro CS (previamente emparejado). Van Hamme y Wasserman proponen que los estímulos activados indirectamente a través de asociaciones internas de compuestos tienen un parámetro de aprendizaje negativo; por lo tanto, se pueden explicar los fenómenos de reevaluación retrospectiva.

Considere el siguiente ejemplo, un paradigma experimental llamado "bloqueo hacia atrás", indicativo de revaluación retrospectiva, donde AB es el estímulo compuesto A+B:

Fase 1: AB-EE.UU.
Fase 2: A-EE.UU.

Ensayos de prueba: el grupo 1, que recibió los ensayos de fase 1 y 2, provoca una respuesta condicionada (CR) más débil a B en comparación con el grupo de control, que solo recibió los ensayos de fase 1.

El modelo RW original no puede tener en cuenta este efecto. Pero el modelo revisado puede: En la Fase 2, el estímulo B se activa indirectamente a través de una asociación dentro del compuesto con A. Pero en lugar de un parámetro de aprendizaje positivo (generalmente llamado alfa) cuando está físicamente presente, durante la Fase 2, B tiene un parámetro de aprendizaje negativo. . Así, durante la segunda fase, la fuerza asociativa de B disminuye mientras que el valor de A aumenta debido a su parámetro de aprendizaje positivo.

Por lo tanto, el modelo RW revisado puede explicar por qué el CR provocado por B después del entrenamiento con bloqueo hacia atrás es más débil en comparación con el acondicionamiento solo con AB.

Algunas fallas del modelo RW

Recuperación espontánea de la extinción y recuperación de la extinción provocada por tratamientos recordatorios (restablecimiento): Es una observación bien establecida que un intervalo de tiempo muerto después de completar la extinción da como resultado una recuperación parcial de la extinción, es decir, la reacción o respuesta previamente extinguida se repite, pero generalmente a un nivel más bajo que antes del entrenamiento de extinción. El restablecimiento se refiere al fenómeno de que la exposición a los EE. UU. únicamente mediante entrenamiento después de completar la extinción da como resultado una recuperación parcial de la extinción. El modelo RW no puede explicar esos fenómenos.

Extinción de un inhibidor previamente condicionado.: El modelo RW predice que la presentación repetida de un inhibidor condicionado solo (un CS con fuerza asociativa negativa) da como resultado la extinción de este estímulo (una disminución de su valor asociativo negativo). Esta es una predicción falsa. Por el contrario, los experimentos muestran que la presentación repetida de un inhibidor condicionado solo incluso aumenta su potencial inhibidor.

Readquisición facilitada después de la extinción: Uno de los supuestos del modelo es que la historia del condicionamiento de un CS no tiene ninguna influencia en su estado actual; sólo es importante su valor asociativo actual. Contrariamente a esta suposición, muchos experimentos ^[4] muestran que los estímulos que primero fueron condicionados y luego extinguidos se reacondicionan más fácilmente (es decir, se necesitan menos ensayos para el condicionamiento).

La exclusividad de la excitación y la inhibición.: El modelo RW también supone que la excitación y la inhibición son características del oponente. Un estímulo puede tener un potencial excitador (una fuerza asociativa positiva) o un potencial inhibidor (una fuerza asociativa negativa), pero no ambos. Por el contrario, a veces se observa que los estímulos pueden tener ambas cualidades. Un ejemplo es el condicionamiento excitador hacia atrás en el que un CS se empareja hacia atrás con un US (US-CS en lugar de CS-US). Esto suele hacer que el CS se convierta en un excitador condicionado. El estímulo también tiene características inhibidoras que pueden comprobarse mediante la prueba de retardo de adquisición. Esta prueba se utiliza para evaluar el potencial inhibidor de un estímulo ya que se observa que se retarda el condicionamiento excitador con un inhibidor previamente condicionado. El estímulo condicionado hacia atrás pasa esta prueba y, por tanto, parece tener características tanto excitadoras como inhibidoras.

Emparejar un estímulo novedoso con un inhibidor condicionado: Se supone que un inhibidor condicionado tiene un valor asociativo negativo. Al presentar a un inhibidor un estímulo nuevo (es decir, su fuerza asociativa es cero), el modelo predice que la señal nueva debería convertirse en un excitador condicionado. Este no es el caso en situaciones experimentales. Las predicciones del modelo surgen de su término básico (lambda-V). Dado que la fuerza asociativa sumada de todos los estímulos (V) presentes en la prueba es negativa (cero + potencial inhibidor) y lambda es cero (no hay EE.UU. presente), el cambio resultante en la fuerza asociativa es positivo, lo que convierte a la nueva señal en una señal condicionada. excitador.

Efecto de preexposición CS: El efecto de preexposición al CS (también llamado inhibición latente ) es la observación bien establecida de que el condicionamiento después de la exposición al estímulo utilizado posteriormente como CS en el condicionamiento se retarda. El modelo RW no predice ningún efecto de presentar un estímulo novedoso sin un EE.UU.

Condicionamiento de orden superior: En el condicionamiento de orden superior, un CS previamente condicionado se combina con una señal nueva (es decir, primero CS1-US y luego CS2-CS1). Esto generalmente hace que la nueva señal CS2 provoque reacciones similares a las de CS1. El modelo no puede explicar este fenómeno ya que durante los ensayos CS2-CS1 no hay ecografía presente. Pero al permitir que CS1 actúe de manera similar a Estados Unidos, se puede conciliar el modelo con este efecto.

Precondicionamiento sensorial: El precondicionamiento sensorial se refiere a emparejar primero dos señales novedosas (CS1-CS2) y luego emparejar una de ellas con una ecografía (CS2-US). Esto convierte a CS1 y CS2 en excitadores condicionados. El modelo RW no puede explicar esto, ya que durante la fase CS1-CS2 ambos estímulos tienen un valor asociativo de cero y lambda también es cero (sin EE.UU. presente), lo que no produce cambios en la fuerza asociativa de los estímulos.

Éxito y popularidad

El modelo Rescorla-Wagner debe su éxito a varios factores, entre ellos ^[2]

tiene relativamente pocos parámetros libres y variables independientes
puede generar predicciones claras y ordinales
ha hecho una serie de predicciones exitosas
Formulado en términos como "predicción" y "sorpresa", el modelo tiene un atractivo intuitivo.
Ha generado una gran cantidad de investigaciones, incluidos muchos hallazgos nuevos y teorías alternativas.

Referencias

^ Nebuloso, Thomas E.; Frank, Michael J.; O'Reilly, Randall C. (1 de abril de 2010). "Mecanismos neuronales que apoyan las respuestas de dopamina fásica adquirida en el aprendizaje: una síntesis integradora". Reseñas de neurociencia y biocomportamiento . 34 (5): 701–720. doi :10.1016/j.neubiorev.2009.11.019. ISSN 0149-7634. PMC 2839018 . PMID 19944716.
^ ab Miller, Ralph R.; Barnet, Robert C.; Grahame, Nicolás J. (1995). «Evaluación del Modelo Rescorla-Wagner» (PDF) . Boletín Psicológico . 117 (3). Asociación Estadounidense de Psicología: 363–386. doi :10.1037/0033-2909.117.3.363. PMID 7777644.
^ Van Hamme, LJ; Wasserman, EA (1994). "Competencia de señales en juicios de causalidad: el papel de la no presentación de elementos de estímulo compuestos" (PDF) . Aprendizaje y Motivación . 25 (2): 127-151. doi :10.1006/lmot.1994.1008. Archivado desde el original (PDF) el 7 de abril de 2014.
^ Napier, RM; Macrae, M.; Kehoe, EJ (1992). "Rápida readquisición en el acondicionamiento de la respuesta de la membrana nictitante del conejo". Revista de Psicología Experimental: Procesos de comportamiento animal . 18 (2): 182-192. doi :10.1037/0097-7403.18.2.182.

Rescorla, RA y Wagner, AR (1972) Una teoría del condicionamiento pavloviano: variaciones en la efectividad del refuerzo y el no refuerzo, Condicionamiento clásico II, AH Black y WF Prokasy, Eds., págs. 64–99. Appleton-Century-Crofts.

enlaces externos

Modelo Scholarpedia Rescorla-Wagner
Simulador RW Simulador de modelo Rescorla-Wagner
Simulador Rescorla-Wagner en navegador
Simulador con diseño