El condicionamiento clásico (también condicionamiento respondiente y condicionamiento pavloviano ) es un procedimiento conductual en el que un estímulo biológicamente potente (por ejemplo, comida, una bocanada de aire en el ojo, un rival potencial) se empareja con un estímulo neutro (por ejemplo, el sonido de un triángulo musical ). El término condicionamiento clásico se refiere al proceso de una respuesta automática y condicionada que se empareja con un estímulo específico. [1]
El fisiólogo ruso Ivan Pavlov estudió el condicionamiento clásico con experimentos detallados con perros, y publicó los resultados experimentales en 1897. En el estudio de la digestión , Pavlov observó que los perros experimentales salivaban cuando se les alimentaba con carne roja. [2] El condicionamiento pavloviano es distinto del condicionamiento operante (condicionamiento instrumental), a través del cual se modifica la fuerza de una conducta voluntaria, ya sea por refuerzo o por castigo . Sin embargo, el condicionamiento clásico puede afectar al condicionamiento operante; los estímulos condicionados clásicamente pueden reforzar las respuestas operantes.
El condicionamiento clásico es un mecanismo conductual básico, y ahora se están empezando a comprender sus sustratos neuronales . Aunque a veces es difícil distinguir el condicionamiento clásico de otras formas de aprendizaje asociativo (por ejemplo, el aprendizaje instrumental y la memoria asociativa humana ), una serie de observaciones los diferencian, especialmente las contingencias mediante las cuales se produce el aprendizaje. [3]
Junto con el condicionamiento operante , el condicionamiento clásico se convirtió en la base del conductismo , una escuela de psicología que fue dominante a mediados del siglo XX y que todavía tiene una influencia importante en la práctica de la terapia psicológica y el estudio del comportamiento animal. El condicionamiento clásico también se ha aplicado en otras áreas. Por ejemplo, puede afectar la respuesta del cuerpo a las drogas psicoactivas , la regulación del hambre, la investigación sobre la base neuronal del aprendizaje y la memoria, y en ciertos fenómenos sociales como el efecto del falso consenso . [4]
El condicionamiento clásico se produce cuando un estímulo condicionado (EC) se combina con un estímulo incondicionado (EI). Por lo general, el estímulo condicionado es un estímulo neutro (p. ej., el sonido de un diapasón ), el estímulo incondicionado es biológicamente potente (p. ej., el sabor de la comida) y la respuesta incondicionada (RI) al estímulo incondicionado es una respuesta refleja no aprendida (p. ej., la salivación). Después de repetir el emparejamiento, el organismo muestra una respuesta condicionada (RC) al estímulo condicionado cuando este se presenta solo. (Una respuesta condicionada puede ocurrir después de un solo emparejamiento). Por lo tanto, a diferencia del RI, la RC se adquiere a través de la experiencia y también es menos permanente que la RI. [5]
Por lo general, la respuesta condicionada es similar a la respuesta incondicionada, pero a veces es bastante diferente. Por esta y otras razones, la mayoría de los teóricos del aprendizaje sugieren que el estímulo condicionado llega a señalar o predecir el estímulo incondicionado, y pasan a analizar las consecuencias de esta señal. [6] Robert A. Rescorla proporcionó un resumen claro de este cambio en el pensamiento, y sus implicaciones, en su artículo de 1988 "Condicionamiento pavloviano: no es lo que crees que es". [7] A pesar de su amplia aceptación, la tesis de Rescorla puede no ser defendible. [8] [ palabras ambiguas ]
El condicionamiento clásico se diferencia del condicionamiento operante o instrumental : en el condicionamiento clásico, las conductas se modifican a través de la asociación de estímulos como se describió anteriormente, mientras que en el condicionamiento operante las conductas se modifican por el efecto que producen (es decir, recompensa o castigo). [9]
El trabajo más conocido y completo sobre el condicionamiento clásico fue realizado por Ivan Pavlov , aunque Edwin Twitmyer publicó algunos hallazgos relacionados un año antes. [10] Durante su investigación sobre la fisiología de la digestión en perros, Pavlov desarrolló un procedimiento que le permitió estudiar los procesos digestivos de los animales durante largos períodos de tiempo. Redirigió los fluidos digestivos de los animales fuera del cuerpo, donde podían medirse.
Pavlov se dio cuenta de que sus perros comenzaban a salivar en presencia del técnico que normalmente los alimentaba, en lugar de simplemente salivar en presencia de comida. Pavlov llamó a la salivación anticipatoria de los perros "secreción psíquica". Poniendo estas observaciones informales a prueba experimentalmente, Pavlov presentó un estímulo (por ejemplo, el sonido de un metrónomo ) y luego le dio comida al perro; después de unas cuantas repeticiones, los perros comenzaron a salivar en respuesta al estímulo. Pavlov concluyó que si un estímulo particular en el entorno del perro estaba presente cuando se le daba comida, entonces ese estímulo podría asociarse con la comida y causar salivación por sí solo.
En los experimentos de Pavlov, el estímulo incondicionado (EI) era la comida porque sus efectos no dependían de la experiencia previa. El sonido del metrónomo es originalmente un estímulo neutro (EN) porque no provoca salivación en los perros. Después del condicionamiento, el sonido del metrónomo se convierte en el estímulo condicionado (EC) o estímulo condicional; porque sus efectos dependen de su asociación con la comida. [11] De la misma manera, las respuestas del perro siguen la misma disposición condicionada versus incondicionada. La respuesta condicionada (RC) es la respuesta al estímulo condicionado, mientras que la respuesta incondicionada (RI) corresponde al estímulo incondicionado.
Pavlov informó muchos hechos básicos sobre el condicionamiento; por ejemplo, descubrió que el aprendizaje se producía más rápidamente cuando el intervalo entre el EC y la aparición del EI era relativamente corto. [12]
Como se señaló anteriormente, a menudo se piensa que la respuesta condicionada es una réplica de la respuesta incondicionada, pero Pavlov notó que la saliva producida por el EC difiere en composición de la producida por el EI. De hecho, la CR puede ser cualquier respuesta nueva al EC previamente neutral que pueda vincularse claramente con la experiencia con la relación condicional del EC y el EI. [7] [9] También se pensaba que los emparejamientos repetidos son necesarios para que surja el condicionamiento, pero muchas CR pueden aprenderse con un solo ensayo, especialmente en el condicionamiento del miedo y el aprendizaje de la aversión al sabor .
El aprendizaje es más rápido en el condicionamiento hacia adelante. Durante el condicionamiento hacia adelante, el inicio del EC precede al inicio del EI para indicar que este último le seguirá. [13] [14] : 69 Dos formas comunes de condicionamiento hacia adelante son el condicionamiento de retraso y el condicionamiento de traza.
Durante el condicionamiento simultáneo, el EC y el EI se presentan y terminan al mismo tiempo. Por ejemplo: si una persona escucha una campana y se le sopla aire en el ojo al mismo tiempo, y emparejamientos repetidos como este llevaron a la persona a parpadear cuando escucha la campana a pesar de que no hay soplo de aire, esto demuestra que se ha producido un condicionamiento simultáneo.
El condicionamiento de segundo orden o de orden superior sigue un procedimiento de dos pasos. Primero, un estímulo neutro ("CS1") llega a enviar una señal a un EI a través del condicionamiento hacia delante. Luego, un segundo estímulo neutro ("CS2") se empareja con el primero (CS1) y llega a producir su propia respuesta condicionada. [14] : 66 Por ejemplo: una campana podría emparejarse con comida hasta que la campana provoque salivación. Si luego se empareja una luz con la campana, entonces la luz también puede llegar a provocar salivación. La campana es el CS1 y la comida es el EI. La luz se convierte en el CS2 una vez que se empareja con el CS1.
El condicionamiento retrógrado se produce cuando un EC sigue inmediatamente a un EI. [13] A diferencia del procedimiento de condicionamiento habitual, en el que el EC precede al EI, la respuesta condicionada dada al EC tiende a ser inhibitoria. Esto presumiblemente sucede porque el EC sirve como señal de que el EI ha terminado, en lugar de como señal de que el EI está a punto de aparecer. [14] : 71 Por ejemplo, una bocanada de aire dirigida al ojo de una persona podría ser seguida por el sonido de un timbre.
En el condicionamiento temporal, se presenta un EI a intervalos regulares, por ejemplo, cada 10 minutos. Se dice que se ha producido un condicionamiento cuando el CR tiende a producirse poco antes de cada EI. Esto sugiere que los animales tienen un reloj biológico que puede servir como EC. Este método también se ha utilizado para estudiar la capacidad de sincronización en animales (véase Cognición animal ).
El ejemplo que se muestra a continuación muestra el condicionamiento temporal, ya que, por ejemplo, se le suministra comida a un ratón hambriento en un horario regular, por ejemplo, cada treinta segundos. Después de una exposición suficiente, el ratón comenzará a salivar justo antes de que se le entregue la comida. Esto lo convierte en un condicionamiento temporal, ya que parecería que el ratón está condicionado al paso del tiempo.
En este procedimiento, el EC se empareja con el EI, pero el EI también ocurre en otros momentos. Si esto ocurre, se predice que es probable que el EI ocurra en ausencia del EC. En otras palabras, el EC no "predice" el EI. En este caso, el condicionamiento falla y el EC no llega a provocar una CR. [15] Este hallazgo –que la predicción , en lugar del emparejamiento EC-EI, es la clave del condicionamiento– influyó en gran medida en la investigación y la teoría del condicionamiento posteriores.
En el procedimiento de extinción, el EC se presenta repetidamente en ausencia de un EI. Esto se hace después de que un EC haya sido condicionado por uno de los métodos anteriores. Cuando esto se hace, la frecuencia de CR finalmente regresa a los niveles previos al entrenamiento. Sin embargo, la extinción no elimina los efectos del condicionamiento previo. Esto se demuestra por la recuperación espontánea (cuando hay una aparición repentina de la CR) después de que ocurre la extinción) y otros fenómenos relacionados (ver "Recuperación de la extinción" a continuación). Estos fenómenos se pueden explicar postulando la acumulación de inhibición cuando se presenta un estímulo débil.
Durante la adquisición, el EC y el EI se emparejan como se ha descrito anteriormente. El grado de condicionamiento puede seguirse mediante ensayos de prueba. En estos ensayos de prueba, el EC se presenta solo y se mide la CR. Un único emparejamiento de EC y EI puede ser suficiente para obtener una CR en una prueba, pero normalmente se necesitan varios emparejamientos y hay un aumento gradual de la respuesta condicionada al EC. Este número repetido de ensayos aumenta la fuerza y/o frecuencia de la CR gradualmente. La velocidad del condicionamiento depende de varios factores, como la naturaleza y la fuerza tanto del EC como del EI, la experiencia previa y el estado motivacional del animal. [6] [9] El proceso se ralentiza a medida que se acerca a su finalización. [16]
Si el EC se presenta sin el EI y este proceso se repite con la suficiente frecuencia, el EC finalmente dejará de provocar una RC. En este punto se dice que la RC está "extinguida". [6] [17]
Se puede observar inhibición externa si se presenta un estímulo fuerte o desconocido justo antes o al mismo tiempo que el EC. Esto provoca una reducción de la respuesta condicionada al EC.
Varios procedimientos conducen a la recuperación de un CR que había sido primero condicionado y luego extinguido. Esto ilustra que el procedimiento de extinción no elimina el efecto del condicionamiento. [9] Estos procedimientos son los siguientes:
Se dice que se produce una generalización del estímulo si, después de que un EC particular ha llegado a provocar una CR, se descubre que un estímulo de prueba similar provoca la misma CR. Por lo general, cuanto más similar sea el estímulo de prueba al EC, más fuerte será la CR con respecto al estímulo de prueba. [6] Por el contrario, cuanto más difiera el estímulo de prueba del EC, más débil será la CR o más diferirá de la observada previamente.
Se observa discriminación de estímulos cuando un estímulo ("CS1") provoca una RC y otro estímulo ("CS2") provoca otra RC o ninguna RC en absoluto. Esto se puede lograr, por ejemplo, emparejando CS1 con un EI efectivo y presentando CS2 sin EI. [6]
La inhibición latente se refiere a la observación de que un estímulo familiar tarda más en convertirse en un EC que un estímulo nuevo en convertirse en un EC cuando el estímulo está emparejado con un EI efectivo. [6]
Esta es una de las formas más comunes de medir la fuerza del aprendizaje en el condicionamiento clásico. Un ejemplo típico de este procedimiento es el siguiente: una rata aprende primero a presionar una palanca a través del condicionamiento operante . Luego, en una serie de ensayos, la rata es expuesta a un EC, una luz o un ruido, seguido del EI, una descarga eléctrica suave. Se desarrolla una asociación entre el EC y el EI, y la rata reduce o deja de presionar la palanca cuando se activa el EC. La velocidad de presión durante el EC mide la fuerza del condicionamiento clásico; es decir, cuanto más lento presione la rata, más fuerte será la asociación del EC y el EI. (La presión lenta indica una respuesta condicionada de "miedo" y es un ejemplo de una respuesta emocional condicionada; consulte la sección siguiente).
Normalmente se utilizan tres fases de acondicionamiento.
Un CS (CS+) se empareja con un US hasta que se alcanzan niveles de CR asintóticos .
Los ensayos CS+/US continúan, pero se intercalan con ensayos en los que el CS+ se combina con un segundo CS (el CS-), pero no con el US (es decir, ensayos CS+/CS-). Por lo general, los organismos muestran respuestas regresivas en los ensayos CS+/US, pero dejan de responder en los ensayos CS+/CS−.
Esta forma de condicionamiento clásico implica dos fases.
Un CS (CS1) está emparejado con un US.
Un CS compuesto (CS1+CS2) se empareja con un US.
Se realiza una prueba independiente para cada EC (EC1 y EC2). El efecto de bloqueo se observa en la falta de respuesta condicional a EC2, lo que sugiere que la primera fase del entrenamiento bloqueó la adquisición del segundo EC.
Los experimentos sobre cuestiones teóricas del condicionamiento se han realizado principalmente en vertebrados , especialmente ratas y palomas. Sin embargo, el condicionamiento también se ha estudiado en invertebrados , y datos muy importantes sobre la base neural del condicionamiento provienen de experimentos con la babosa marina, Aplysia . [6] La mayoría de los experimentos relevantes han utilizado el procedimiento de condicionamiento clásico, aunque también se han utilizado experimentos de condicionamiento instrumental (operante) , y la fuerza del condicionamiento clásico a menudo se mide a través de sus efectos operantes, como en la supresión condicionada (ver la sección Fenómenos más arriba) y el automodelado .
Según Pavlov, el condicionamiento no implica la adquisición de ningún comportamiento nuevo, sino más bien la tendencia a responder de formas antiguas a nuevos estímulos. Por lo tanto, teorizó que el EC simplemente sustituye al EI en la evocación de la respuesta refleja . Esta explicación se llama la teoría del condicionamiento por sustitución de estímulo. [14] : 84 Un problema crítico con la teoría de la sustitución de estímulo es que el CR y el UR no siempre son lo mismo. El propio Pavlov observó que la saliva de un perro producida como CR difería en composición de la producida como UR. [10] El CR es a veces incluso lo opuesto al UR. Por ejemplo: la respuesta incondicional a una descarga eléctrica es un aumento en la frecuencia cardíaca, mientras que un EC que se ha emparejado con la descarga eléctrica provoca una disminución de la frecuencia cardíaca. (Sin embargo, se ha propuesto [¿ por quién? ] que solo cuando el UR no involucra al sistema nervioso central son opuestos el CR y el UR.)
El modelo de Rescorla-Wagner (R-W) [9] [18] es un modelo de condicionamiento relativamente simple pero poderoso. El modelo predice una serie de fenómenos importantes, pero también falla en aspectos importantes, lo que conduce a una serie de modificaciones y modelos alternativos. Sin embargo, debido a que gran parte de la investigación teórica sobre el condicionamiento en los últimos 40 años ha sido instigada por este modelo o reacciones a él, el modelo R-W merece una breve descripción aquí. [19] [14] : 85
El modelo de Rescorla-Wagner sostiene que existe un límite a la cantidad de condicionamiento que puede ocurrir en el emparejamiento de dos estímulos. Un determinante de este límite es la naturaleza del EI. Por ejemplo: emparejar una campana con un filete jugoso tiene más probabilidades de producir salivación que emparejar la campana con un trozo de pan seco, y el pan seco es más probable que funcione que un trozo de cartón. Una idea clave detrás del modelo R-W es que un EC señala o predice el EI. Se podría decir que antes del condicionamiento, el EC sorprende al sujeto con el EI. Sin embargo, después del condicionamiento, el sujeto ya no está sorprendido, porque el EC predice la llegada del EI. (El modelo se puede describir matemáticamente y palabras como predecir, sorprender y esperar solo se utilizan para ayudar a explicar el modelo). Aquí se ilustra el funcionamiento del modelo con breves descripciones de adquisición, extinción y bloqueo. El modelo también predice una serie de otros fenómenos, consulte el artículo principal sobre el modelo.
Esta es la ecuación de Rescorla-Wagner. Especifica la cantidad de aprendizaje que se producirá en un único emparejamiento de un estímulo condicionante (EC) con un estímulo incondicionado (EI). La ecuación anterior se resuelve repetidamente para predecir el curso del aprendizaje a lo largo de muchos de esos ensayos.
En este modelo, el grado de aprendizaje se mide por la precisión con la que el EC predice el EI, lo que se obtiene por la "fuerza asociativa" del EC. En la ecuación, V representa la fuerza asociativa actual del EC y ∆V es el cambio en esta fuerza que ocurre en un ensayo determinado. ΣV es la suma de las fuerzas de todos los estímulos presentes en la situación. λ es la fuerza asociativa máxima que un EI determinado soportará; su valor suele establecerse en 1 en los ensayos en los que el EI está presente y en 0 cuando el EI está ausente. α y β son constantes relacionadas con la prominencia del EC y la velocidad de aprendizaje para un EI determinado. En las siguientes secciones se explica cómo la ecuación predice varios resultados experimentales. Para más detalles, consulte el artículo principal sobre el modelo. [14] : 85–89
El modelo R–W mide el condicionamiento asignando una "fuerza asociativa" al EC y otros estímulos locales. Antes de que un EC sea condicionado tiene una fuerza asociativa de cero. El emparejamiento del EC y el EI provoca un aumento gradual en la fuerza asociativa del EC. Este aumento está determinado por la naturaleza del EI (por ejemplo, su intensidad). [14] : 85–89 La cantidad de aprendizaje que ocurre durante cualquier emparejamiento EC-EI depende de la diferencia entre las fuerzas asociativas totales del EC y otros estímulos presentes en la situación (ΣV en la ecuación), y un máximo establecido por el EI (λ en la ecuación). En el primer emparejamiento del EC y el EI, esta diferencia es grande y la fuerza asociativa del EC da un gran paso hacia arriba. A medida que se acumulan emparejamientos EC-EI, el EI se vuelve más predecible y el aumento de la fuerza asociativa en cada ensayo se vuelve cada vez más pequeño. Finalmente, la diferencia entre la fuerza asociativa del EC (más cualquier otra que pueda acumularse con otros estímulos) y la fuerza máxima llega a cero. Es decir, el EI se predice por completo, la fuerza asociativa del EC deja de crecer y el condicionamiento se completa.
El proceso asociativo descrito por el modelo R–W también explica la extinción (ver "procedimientos" más arriba). El procedimiento de extinción comienza con una fuerza asociativa positiva del EC, lo que significa que el EC predice que se producirá el EI. En un ensayo de extinción, el EI no se produce después del EC. Como resultado de este resultado "sorprendente", la fuerza asociativa del EC disminuye. La extinción se completa cuando la fuerza del EC llega a cero; no se predice ningún EI y éste no se produce. Sin embargo, si ese mismo EC se presenta sin el EI pero acompañado de un inhibidor condicionado (IC) bien establecido, es decir, un estímulo que predice la ausencia de un EI (en términos de RW, un estímulo con una fuerza asociativa negativa), entonces RW predice que el EC no se extinguirá (su V no disminuirá de tamaño).
La contribución más importante y novedosa del modelo R–W es su suposición de que el condicionamiento de un EC depende no sólo de ese EC y su relación con el EI, sino también de todos los demás estímulos presentes en la situación de condicionamiento. En particular, el modelo afirma que el EI se predice mediante la suma de las fortalezas asociativas de todos los estímulos presentes en la situación de condicionamiento. El aprendizaje está controlado por la diferencia entre esta fortaleza asociativa total y la fortaleza apoyada por el EI. Cuando esta suma de fortalezas alcanza un máximo establecido por el EI, el condicionamiento termina como se acaba de describir. [14] : 85–89
La explicación R–W del fenómeno de bloqueo ilustra una consecuencia de la suposición que acabamos de plantear. En el bloqueo (véase "fenómenos" más arriba), el CS1 se empareja con un EI hasta que se completa el condicionamiento. Luego, en ensayos de condicionamiento adicionales, aparece un segundo estímulo (CS2) junto con el CS1, y ambos son seguidos por el EI. Finalmente, se prueba el CS2 y se demuestra que no produce respuesta porque el aprendizaje sobre el CS2 fue "bloqueado" por el aprendizaje inicial sobre el CS1. El modelo R–W explica esto diciendo que después del condicionamiento inicial, el CS1 predice completamente el EI. Dado que no hay diferencia entre lo que se predice y lo que sucede, no se produce ningún aprendizaje nuevo en los ensayos adicionales con el CS1 + el CS2, por lo que el CS2 no produce respuesta más adelante.
Una de las principales razones de la importancia del modelo R–W es que es relativamente simple y hace predicciones claras. Las pruebas de estas predicciones han llevado a una serie de nuevos hallazgos importantes y a una comprensión considerablemente mayor del condicionamiento. Algunos datos nuevos han apoyado la teoría, pero muchos no, y en general se acepta que la teoría es, en el mejor de los casos, demasiado simple. Sin embargo, ningún modelo parece explicar todos los fenómenos que los experimentos han producido. [9] [20] A continuación se presentan breves resúmenes de algunas cuestiones teóricas relacionadas. [19]
El modelo R-W reduce el condicionamiento a la asociación de un EC y un EI, y lo mide con un único número, la fuerza asociativa del EC. Una serie de hallazgos experimentales indican que se aprende más que esto. Entre ellos se encuentran dos fenómenos descritos anteriormente en este artículo.
La inhibición latente puede ocurrir porque un sujeto deja de concentrarse en un EC que ve con frecuencia antes de que se empareje con un EI. De hecho, los cambios en la atención al EC están en el centro de dos teorías prominentes que intentan lidiar con los resultados experimentales que le dan dificultad al modelo R–W. En una de ellas, propuesta por Nicholas Mackintosh [21] , la velocidad del condicionamiento depende de la cantidad de atención dedicada al EC, y esta cantidad de atención depende a su vez de qué tan bien el EC predice el EI. Pearce y Hall propusieron un modelo relacionado basado en un principio atencional diferente [22]. Ambos modelos han sido probados ampliamente, y ninguno explica todos los resultados experimentales. En consecuencia, varios autores han intentado modelos híbridos que combinan los dos procesos atencionales. Pearce y Hall en 2010 integraron sus ideas atencionales e incluso sugirieron la posibilidad de incorporar la ecuación de Rescorla-Wagner en un modelo integrado. [9]
Como se dijo antes, una idea clave en el condicionamiento es que el EC señala o predice el EI (ver "procedimiento de contingencia cero" más arriba). Sin embargo, por ejemplo, la habitación en la que tiene lugar el condicionamiento también "predice" que el EI puede ocurrir. Aun así, la habitación predice con mucha menos certeza que el EC experimental en sí, porque la habitación también está allí entre los ensayos experimentales, cuando el EI está ausente. El papel de dicho contexto se ilustra por el hecho de que los perros en el experimento de Pavlov a veces comenzaban a salivar cuando se acercaban al aparato experimental, antes de ver u oír cualquier EC. [16] Estos llamados estímulos de "contexto" siempre están presentes, y su influencia ayuda a explicar algunos hallazgos experimentales que de otro modo serían desconcertantes. La fuerza asociativa de los estímulos de contexto se puede introducir en la ecuación de Rescorla-Wagner, y desempeñan un papel importante en las teorías comparativas y computacionales que se describen a continuación. [9]
Para averiguar qué se ha aprendido, debemos medir de algún modo el comportamiento ("rendimiento") en una situación de prueba. Sin embargo, como los estudiantes saben muy bien, el rendimiento en una situación de prueba no siempre es una buena medida de lo que se ha aprendido. En cuanto al condicionamiento, hay evidencia de que los sujetos en un experimento de bloqueo aprenden algo sobre el EC "bloqueado", pero no logran demostrar este aprendizaje debido a la forma en que se los suele evaluar.
Las teorías de condicionamiento "comparativas" se basan en el rendimiento, es decir, hacen hincapié en lo que ocurre en el momento de la prueba. En particular, analizan todos los estímulos que están presentes durante la prueba y cómo pueden interactuar las asociaciones adquiridas por estos estímulos. [23] [24] Para simplificar un poco, las teorías comparativas suponen que durante el condicionamiento el sujeto adquiere asociaciones tanto EC-EI como contexto-EI. En el momento de la prueba, se comparan estas asociaciones y se produce una respuesta al EC solo si la asociación EC-EI es más fuerte que la asociación contexto-EI. Después de que un EC y un EI se aparean repetidamente en una adquisición simple, la asociación EC-EI es fuerte y la asociación contexto-EI es relativamente débil. Esto significa que el EC provoca una CR fuerte. En la "contingencia cero" (véase más arriba), la respuesta condicionada es débil o ausente porque la asociación contexto-EI es casi tan fuerte como la asociación EC-EI. El bloqueo y otros fenómenos más sutiles también pueden explicarse mediante teorías comparativas, aunque, nuevamente, no pueden explicar todo. [9] [19]
La necesidad de un organismo de predecir eventos futuros es central para las teorías modernas de condicionamiento. La mayoría de las teorías utilizan asociaciones entre estímulos para encargarse de estas predicciones. Por ejemplo: En el modelo R–W, la fuerza asociativa de un EC nos dice cuán fuertemente ese EC predice un EI. Un enfoque diferente para la predicción es sugerido por modelos como el propuesto por Gallistel & Gibbon (2000, 2002). [25] [26] Aquí la respuesta no está determinada por las fuerzas asociativas. En cambio, el organismo registra los tiempos de inicio y fin de los EC y los EI y los usa para calcular la probabilidad de que el EI siga al EC. Una serie de experimentos han demostrado que los humanos y los animales pueden aprender a cronometrar eventos (ver Cognición animal ), y el modelo de Gallistel & Gibbon produce muy buenos ajustes cuantitativos a una variedad de datos experimentales. [6] [19] Sin embargo, estudios recientes han sugerido que los modelos basados en la duración no pueden explicar algunos hallazgos empíricos tan bien como los modelos asociativos. [27]
El modelo de Rescorla-Wagner trata un estímulo como una entidad única y representa la fuerza asociativa de un estímulo con un número, sin registro de cómo se alcanzó ese número. Como se señaló anteriormente, esto dificulta que el modelo explique una serie de resultados experimentales. Se proporciona más flexibilidad al suponer que un estímulo está representado internamente por una colección de elementos, cada uno de los cuales puede cambiar de un estado asociativo a otro. Por ejemplo, la similitud de un estímulo con otro puede representarse diciendo que los dos estímulos comparten elementos en común. Estos elementos compartidos ayudan a explicar la generalización del estímulo y otros fenómenos que pueden depender de la generalización. Además, diferentes elementos dentro del mismo conjunto pueden tener diferentes asociaciones, y sus activaciones y asociaciones pueden cambiar en diferentes momentos y a diferentes velocidades. Esto permite que los modelos basados en elementos manejen algunos resultados que de otro modo serían inexplicables.
Un ejemplo destacado del enfoque de elementos es el modelo "SOP" de Wagner. [28] El modelo se ha elaborado de diversas maneras desde su introducción y ahora puede explicar en principio una amplia variedad de hallazgos experimentales. [9] El modelo representa cualquier estímulo dado con una gran colección de elementos. El momento de presentación de varios estímulos, el estado de sus elementos y las interacciones entre los elementos determinan el curso de los procesos asociativos y las conductas observadas durante los experimentos de condicionamiento.
La explicación del condicionamiento simple del SOP ejemplifica algunos aspectos esenciales del modelo SOP. Para empezar, el modelo supone que el EC y el EI están representados cada uno por un gran grupo de elementos. Cada uno de estos elementos de estímulo puede estar en uno de tres estados:
De los elementos que representan un único estímulo en un momento dado, algunos pueden estar en el estado A1, algunos en el estado A2 y algunos en el estado I.
Cuando aparece un estímulo por primera vez, algunos de sus elementos saltan de la inactividad I a la actividad primaria A1. Desde el estado A1 decaen gradualmente hasta A2 y finalmente vuelven a I. La actividad de los elementos solo puede cambiar de esta manera; en particular, los elementos en A2 no pueden volver directamente a A1. Si los elementos tanto del EC como del EI están en el estado A1 al mismo tiempo, se aprende una asociación entre los dos estímulos. Esto significa que si, en un momento posterior, el EC se presenta antes que el EI y algunos elementos del EC entran en A1, estos elementos activarán algunos elementos del EI. Sin embargo, los elementos del EI activados indirectamente de esta manera solo se potencian hasta el estado A2. (Esto puede pensarse como si el EC despertara un recuerdo del EI, que no será tan fuerte como el real). Con ensayos repetidos de EC-EI, se asocian cada vez más elementos, y cada vez más elementos del EI van a A2 cuando aparece el EC. Esto deja gradualmente cada vez menos elementos del EI que pueden entrar en A1 cuando aparece el propio EI. En consecuencia, el aprendizaje se ralentiza y se acerca a un límite. Se podría decir que lo de EE.UU. está "totalmente previsto" o "no es sorprendente" porque casi todos sus elementos sólo pueden entrar en A2 cuando entra en juego el CS, dejando pocos para formar nuevas asociaciones.
El modelo puede explicar los hallazgos que se explican mediante el modelo de Rescorla-Wagner y también una serie de hallazgos adicionales. Por ejemplo, a diferencia de la mayoría de los otros modelos, SOP tiene en cuenta el tiempo. El aumento y la disminución de la activación de los elementos permite al modelo explicar los efectos dependientes del tiempo, como el hecho de que el condicionamiento es más fuerte cuando el EC viene justo antes del EI, y que cuando el EC viene después del EI ("condicionamiento hacia atrás") el resultado es a menudo un EC inhibitorio. También se explican muchos otros fenómenos más sutiles. [9]
En los últimos años han aparecido otros modelos potentes que incorporan representaciones de elementos. Estos a menudo incluyen la suposición de que las asociaciones implican una red de conexiones entre "nodos" que representan estímulos, respuestas y quizás una o más capas "ocultas" de interconexiones intermedias. Estos modelos entran en contacto con una explosión actual de investigación sobre redes neuronales , inteligencia artificial y aprendizaje automático . [ cita requerida ]
Pavlov propuso que el condicionamiento implicaba una conexión entre los centros cerebrales para los estímulos condicionados e incondicionados. Su explicación fisiológica del condicionamiento ha sido abandonada, pero el condicionamiento clásico continúa utilizándose para estudiar las estructuras y funciones neuronales que subyacen al aprendizaje y la memoria. Las formas de condicionamiento clásico que se utilizan para este propósito incluyen, entre otras, el condicionamiento del miedo , el condicionamiento del parpadeo y el condicionamiento de la contracción del pie de Hermissenda crassicornis , una babosa marina. Tanto el condicionamiento del miedo como el del parpadeo implican un estímulo neutro, con frecuencia un tono, que se empareja con un estímulo incondicionado. En el caso del condicionamiento del parpadeo, el EI es una bocanada de aire, mientras que en el condicionamiento del miedo el EI es amenazante o aversivo, como una descarga eléctrica en el pie.
El neurocientífico estadounidense David A. McCormick realizó experimentos que demostraron que "... regiones discretas del cerebelo y áreas asociadas del tronco encefálico contienen neuronas que alteran su actividad durante el condicionamiento; estas regiones son fundamentales para la adquisición y el desempeño de esta tarea de aprendizaje simple. Parece que otras regiones del cerebro, incluido el hipocampo , la amígdala y la corteza prefrontal , contribuyen al proceso de condicionamiento, especialmente cuando las demandas de la tarea se vuelven más complejas". [29]
El condicionamiento del miedo y del parpadeo implican generalmente circuitos neuronales que no se superponen, pero comparten mecanismos moleculares. El condicionamiento del miedo se produce en la amígdala basolateral , que recibe entrada glutamatérgica directamente de las aferencias talámicas, así como indirectamente de las proyecciones prefrontales. Las proyecciones directas son suficientes para el condicionamiento de retraso, pero en el caso del condicionamiento de traza, donde el EC necesita estar representado internamente a pesar de la falta de estímulo externo, son necesarias vías indirectas. La corteza cingulada anterior es un candidato para el condicionamiento de traza intermedia, pero el hipocampo también puede desempeñar un papel importante. La activación presináptica de la proteína quinasa A y la activación postsináptica de los receptores NMDA y su vía de transducción de señales son necesarias para la plasticidad relacionada con el condicionamiento. CREB también es necesario para la plasticidad relacionada con el condicionamiento , y puede inducir la síntesis descendente de proteínas necesarias para que esto ocurra. [30] Como los receptores NMDA solo se activan después de un aumento del calcio presináptico (liberando así el bloqueo de Mg2+ ), son un detector de coincidencia potencial que podría mediar la plasticidad dependiente del tiempo de pico . STDP restringe LTP a situaciones en las que el CS predice el US y LTD a lo inverso. [31]
Algunas terapias asociadas al condicionamiento clásico son la terapia de aversión , la desensibilización sistemática y la inundación .
La terapia de aversión es un tipo de terapia conductual diseñada para hacer que los pacientes abandonen un hábito indeseable al asociar el hábito con un estímulo incondicionado fuerte y desagradable. [32] : 336 Por ejemplo, se podría utilizar un medicamento para asociar el sabor del alcohol con el malestar estomacal. La desensibilización sistemática es un tratamiento para las fobias en el que se entrena al paciente para que se relaje mientras se lo expone a estímulos que provocan cada vez más ansiedad (por ejemplo, palabras de enojo). Este es un ejemplo de contracondicionamiento , destinado a asociar los estímulos temidos con una respuesta (relajación) que es incompatible con la ansiedad [32] : 136 La inundación es una forma de desensibilización que intenta eliminar las fobias y las ansiedades mediante la exposición repetida a estímulos altamente angustiantes hasta que la falta de refuerzo de la respuesta de ansiedad causa su extinción. [32] : 133 La "inundación" generalmente implica la exposición real a los estímulos, mientras que el término "implosión" se refiere a la exposición imaginaria, pero a veces los dos términos se usan como sinónimos.
Las terapias de condicionamiento suelen requerir menos tiempo que las terapias humanísticas . [33]
Un estímulo que está presente cuando se administra o consume una droga puede eventualmente evocar una respuesta fisiológica condicionada que imita el efecto de la droga. Este es a veces el caso con la cafeína ; los bebedores habituales de café pueden encontrar que el olor del café les da una sensación de alerta. En otros casos, la respuesta condicionada es una reacción compensatoria que tiende a contrarrestar los efectos de la droga. Por ejemplo, si una droga hace que el cuerpo se vuelva menos sensible al dolor, la reacción compensatoria condicionada puede ser una que haga que el usuario sea más sensible al dolor. Esta reacción compensatoria puede contribuir a la tolerancia a la droga . Si es así, un consumidor de drogas puede aumentar la cantidad de droga consumida para sentir sus efectos y terminar tomando cantidades muy grandes de la droga. En este caso, puede ocurrir una reacción de sobredosis peligrosa si el CS está ausente, de modo que el efecto compensatorio condicionado no se produce. Por ejemplo, si la droga siempre se ha administrado en la misma habitación, los estímulos proporcionados por esa habitación pueden producir un efecto compensatorio condicionado; Entonces puede ocurrir una reacción de sobredosis si el medicamento se administra en un lugar diferente donde los estímulos condicionados están ausentes. [34]
Las señales que preceden constantemente a la ingesta de alimentos pueden convertirse en estímulos condicionados para un conjunto de respuestas corporales que preparan el cuerpo para la comida y la digestión . Estas respuestas reflejas incluyen la secreción de jugos digestivos en el estómago y la secreción de ciertas hormonas en el torrente sanguíneo, e inducen un estado de hambre. Un ejemplo de hambre condicionada es el "efecto del aperitivo". Cualquier señal que precede constantemente a una comida, como un reloj que indica que es hora de cenar, puede hacer que las personas sientan más hambre que antes de la señal. El hipotálamo lateral (LH) está involucrado en el inicio de la alimentación. Se ha demostrado que la vía nigroestriatal , que incluye la sustancia negra , el hipotálamo lateral y los ganglios basales , está involucrada en la motivación del hambre. [ cita requerida ]
La influencia del condicionamiento clásico se puede ver en respuestas emocionales como la fobia , el asco , las náuseas , la ira y la excitación sexual . Un ejemplo común son las náuseas condicionadas, en las que el EC es la visión o el olor de un alimento en particular que en el pasado ha provocado un malestar estomacal no condicionado. De manera similar, cuando el EC es la visión de un perro y el EI es el dolor de ser mordido, el resultado puede ser un miedo condicionado a los perros. Un ejemplo de respuesta emocional condicionada es la supresión condicionada.
Como mecanismo adaptativo, el condicionamiento emocional ayuda a proteger a un individuo de sufrir daños o a prepararlo para acontecimientos biológicos importantes como la actividad sexual. Así, un estímulo que se ha producido antes de la interacción sexual llega a provocar excitación sexual, lo que prepara al individuo para el contacto sexual. Por ejemplo, la excitación sexual se ha condicionado en sujetos humanos emparejando un estímulo como una imagen de un tarro de monedas con vistas a un clip de película erótica. Experimentos similares con peces gourami azules y codornices domesticadas han demostrado que dicho condicionamiento puede aumentar el número de crías. Estos resultados sugieren que las técnicas de condicionamiento podrían ayudar a aumentar las tasas de fertilidad en individuos infértiles y especies en peligro de extinción . [35]
La transferencia pavloviana-instrumental es un fenómeno que ocurre cuando un estímulo condicionado (EC, también conocido como "señal") que se ha asociado con estímulos gratificantes o aversivos a través del condicionamiento clásico altera la relevancia motivacional y la conducta operante . [36] [37] [38] [39] En un experimento típico, a una rata se le presentan pares de sonido y comida (condicionamiento clásico). Por separado, la rata aprende a presionar una palanca para obtener comida (condicionamiento operante). Las sesiones de prueba ahora muestran que la rata presiona la palanca más rápido en presencia del sonido que en silencio, aunque el sonido nunca se ha asociado con presionar la palanca.
Se sugiere que la transferencia pavloviana-instrumental desempeña un papel en el efecto de resultados diferenciales , un procedimiento que mejora la discriminación operante al emparejar estímulos con resultados específicos. [ cita requerida ]
Este artículo revisa uno de los paradigmas experimentales utilizados para estudiar los efectos de las señales, el paradigma de transferencia pavloviana a instrumental. En este paradigma, las señales asociadas con recompensas a través del condicionamiento pavloviano alteran la motivación y la elección de acciones instrumentales. ... Las señales predictivas son una parte importante de nuestra vida que influyen y guían continuamente nuestras acciones. Escuchar el sonido de una bocina nos hace detenernos antes de intentar cruzar la calle. Ver un anuncio de comida rápida puede hacernos sentir hambre y llevarnos a buscar un tipo y una fuente específicos de comida. En general, las señales pueden incitarnos a realizar una determinada acción o impedirnos hacerlo. Pueden ser adaptativas (salvarnos la vida al cruzar la calle) o maladaptativas, lo que nos lleva a tomar decisiones que no son las óptimas, por ejemplo, hacernos comer cuando en realidad no tenemos hambre (Colagiuri y Lovibond, 2015). En casos extremos, incluso pueden desempeñar un papel en patologías como la adicción, en la que las señales asociadas a las drogas generan ansia y provocan recaídas (Belin et al., 2009).
La prominencia del incentivo o 'querer' es una forma específica de motivación relacionada con Pavlov para recompensas mediada por sistemas cerebrales mesocorticolímbicos ... La prominencia del incentivo integra dos factores de entrada separados: (1) estado neurobiológico fisiológico actual; (2) asociaciones aprendidas previamente sobre la señal de recompensa, o EC pavloviano ...
'Querer' activado por señal para el UCS
Un breve encuentro de EC (o breve encuentro de UCS) a menudo prepara un pulso de motivación elevada para obtener y consumir más UCS de recompensa. Esta es una característica distintiva de la prominencia de incentivos. En la vida diaria, el olor de la comida puede hacer que de repente sientas hambre, cuando no la habías sentido un minuto antes. En experimentos de neurociencia animal, un EC por recompensa puede desencadenar un pulso más frenético de mayores esfuerzos instrumentales para obtener esa recompensa de ECV asociada en situaciones que purifican la medición de la prominencia de incentivos, como en experimentos de Transferencia Pavloviana-Instrumental (PIT) ... De manera similar, incluir un EC puede a menudo estimular un mayor consumo de un ECV de recompensa por parte de ratas o personas, en comparación con el consumo del mismo ECV cuando no hay ECV ... Por lo tanto, las señales pavlovianas pueden provocar pulsos de mayor motivación para consumir su recompensa de ECV, avivando e intensificando el apetito. Sin embargo, el poder de la motivación nunca está simplemente en las señales en sí mismas o sus asociaciones, ya que la motivación desencadenada por señales puede ser fácilmente modulada y revertida por drogas, hambre, saciedad, etc., como se analiza a continuación.
{{cite book}}
: Mantenimiento de CS1: postscript ( enlace )