El modelado es un paradigma de condicionamiento utilizado principalmente en el análisis experimental del comportamiento . El método utilizado es el reforzamiento diferencial de aproximaciones sucesivas . Fue introducido por BF Skinner [1] con palomas y extendido a perros, delfines, humanos y otras especies. En el modelado, la forma de una respuesta existente se cambia gradualmente a lo largo de ensayos sucesivos hacia un comportamiento objetivo deseado mediante el refuerzo de segmentos exactos de comportamiento. La explicación de Skinner del modelado fue la siguiente:
Primero le damos comida al pájaro cuando se gira ligeramente en dirección al punto desde cualquier parte de la jaula. Esto aumenta la frecuencia de tal comportamiento. Luego suspendemos el refuerzo hasta que realiza un ligero movimiento hacia el punto. Esto altera nuevamente la distribución general del comportamiento sin producir una nueva unidad. Continuamos reforzando posiciones sucesivamente más cercanas al punto, luego reforzando sólo cuando la cabeza se mueve ligeramente hacia adelante y finalmente sólo cuando el pico realmente hace contacto con el punto. ... La probabilidad original de la respuesta en su forma final es muy baja; en algunos casos puede incluso ser cero. De esta manera podemos construir operantes complicados que de otra manera nunca aparecerían en el repertorio del organismo. Al reforzar una serie de aproximaciones sucesivas, llevamos una respuesta rara a una probabilidad muy alta en un corto tiempo. ... El acto total de girar hacia el punto desde cualquier punto de la caja, caminar hacia él, levantar la cabeza y golpear el punto puede parecer una unidad de comportamiento funcionalmente coherente; pero se construye mediante un proceso continuo de refuerzo diferencial a partir de un comportamiento indiferenciado, tal como el escultor da forma a su figura a partir de un trozo de arcilla. [2]
Las aproximaciones sucesivas reforzadas son aproximaciones cada vez más cercanas a la conducta objetivo establecida por el entrenador. A medida que avanza el entrenamiento, el entrenador deja de reforzar las aproximaciones menos precisas. Cuando el entrenador deja de reforzar esta conducta, el alumno pasará por un período de extinción en el que realizará muchas conductas en un intento de recibir ese refuerzo. El entrenador elegirá una de esas conductas que sea una aproximación más cercana a la conducta objetivo y reforzará esa conducta elegida. [3] El entrenador repite este proceso con las aproximaciones sucesivas acercándose a la respuesta objetivo hasta que el alumno logre la conducta deseada.
Por ejemplo, para entrenar a una rata a presionar una palanca, se podrían aplicar las siguientes aproximaciones sucesivas:
El entrenador comienza reforzando todas las conductas de la primera categoría, en este caso girar hacia la palanca. Cuando el animal realiza regularmente esa respuesta (girarse), el entrenador restringe el refuerzo a las respuestas de la segunda categoría (moverse hacia), luego a la tercera, y así sucesivamente, progresando hacia cada aproximación más precisa a medida que el animal aprende la que se refuerza actualmente. De este modo, la respuesta se aproxima gradualmente a la conducta deseada hasta que finalmente se establece la respuesta objetivo (presionar la palanca). Al principio, es poco probable que la rata presione la palanca; al final, lo hace rápidamente.
El modelado a veces falla. Un ejemplo que se cita con frecuencia es el intento de Marian y Keller Breland (alumnos de BF Skinner) de modelar a un cerdo y a un mapache para que depositaran una moneda en una alcancía, utilizando la comida como reforzador. En lugar de aprender a depositar la moneda, el cerdo empezó a hundirla en el suelo y el mapache “lavó” y frotó las monedas entre sí. Es decir, los animales trataron la moneda de la misma manera que tratan los alimentos que se preparaban para comer, lo que se conoce como conductas de “obtención de comida”. En el caso del mapache, pudo aprender a depositar una moneda en la alcancía para obtener una recompensa de comida, pero cuando se cambiaron las contingencias de modo que se requirieran dos monedas para obtener la recompensa, el mapache no pudo aprender la nueva regla, más compleja. Después de lo que podría caracterizarse como expresiones de frustración, el mapache recurre a conductas básicas de “obtención de comida” comunes a su especie. Estos resultados muestran una limitación en la capacidad cognitiva del mapache para siquiera concebir la posibilidad de que dos monedas pudieran intercambiarse por comida, independientemente de las contingencias de autoformación existentes. Desde que se publicaron las observaciones de Breland, se han publicado muchos otros ejemplos de respuestas no entrenadas a estímulos naturales; en muchos contextos, los estímulos se denominan "estímulos de señales" y las conductas relacionadas se denominan "seguimiento de señales". [4] [5]
El modelado se utiliza para entrenar respuestas operantes en animales de laboratorio y en el análisis conductual aplicado para cambiar conductas humanas o animales consideradas inadaptadas o disfuncionales. También se puede utilizar para enseñar conductas a alumnos que se niegan a realizar la conducta objetivo o tienen dificultades para lograrla. Este procedimiento desempeña un papel importante en el entrenamiento comercial de animales. El modelado ayuda a la "discriminación", que es la capacidad de diferenciar entre estímulos que se refuerzan y los que no, y a la "generalización", que es la aplicación de una respuesta aprendida en una situación a una situación diferente pero similar. [6]
El moldeado también se puede utilizar en un centro de rehabilitación . Por ejemplo, el entrenamiento en barras paralelas puede asemejarse a caminar con un andador . [7] O el moldeado puede enseñar a los pacientes cómo aumentar el tiempo entre las visitas al baño.
El automodelado (a veces llamado seguimiento de señales ) es cualquiera de una variedad de procedimientos experimentales utilizados para estudiar el condicionamiento clásico . En el automodelado, a diferencia del moldeado, la recompensa llega independientemente del comportamiento del animal. En su forma más simple, el automodelado es muy similar al procedimiento de condicionamiento salival de Pavlov con perros. En el procedimiento más conocido de Pavlov, un tono audible corto precedió de manera confiable la presentación de comida a los perros. Los perros, de manera natural e incondicional, salivaban ( respuesta incondicionada ) a la comida ( estímulo incondicionado ) que se les daba, pero a través del aprendizaje, de manera condicional, llegaban a salivar ( respuesta condicionada ) al tono ( estímulo condicionado ) que predecía la comida. En el automodelado, se enciende una luz de manera confiable poco antes de que se les dé comida a los animales. Los animales, de manera natural e incondicional, muestran reacciones consumatorias a la comida que se les da, pero a través del aprendizaje, de manera condicional, llegan a realizar esas mismas acciones consumatorias dirigidas al estímulo condicionado que predice la comida.
El automodelado plantea un interesante dilema para la afirmación de BF Skinner de que se debe emplear el modelado como método para enseñar a una paloma a picotear una llave. Después de todo, si un animal puede moldearse a sí mismo, ¿por qué utilizar el laborioso proceso de moldeamiento? El automodelado también contradice el principio de reforzamiento de Skinner. Durante el automodelado, la comida llega independientemente de la conducta del animal. Si se estuviera produciendo un reforzamiento, las conductas aleatorias deberían aumentar en frecuencia porque deberían haber sido recompensadas con comida aleatoria. No obstante, el picoteo de llaves se desarrolla de manera fiable en las palomas, [8] incluso si esta conducta nunca hubiera sido recompensada.
Pero la evidencia más clara de que el automodelado está bajo control pavloviano y no skinneriano se encontró utilizando el procedimiento de omisión. En ese procedimiento, [9] normalmente se programa la entrega de comida después de cada presentación de un estímulo (a menudo un destello de luz), excepto en los casos en que el animal realmente realiza una respuesta consumatoria al estímulo, en cuyo caso se le niega la comida. Aquí, si la conducta estuviera bajo control instrumental, el animal dejaría de intentar consumir el estímulo, ya que esa conducta es seguida por la retención de la comida. Pero los animales persisten en intentar consumir el estímulo condicionado durante miles de ensayos [10] (un fenómeno conocido como automantenimiento negativo ), incapaces de cesar su respuesta conductual al estímulo condicionado incluso cuando les impide obtener una recompensa.
{{cite book}}
: CS1 maint: varios nombres: lista de autores ( enlace )