La elección forzada de dos alternativas ( 2AFC ) es un método para medir la sensibilidad de una persona o un animal a una determinada entrada sensorial, un estímulo , a través del patrón de elecciones de ese observador y los tiempos de respuesta a dos versiones de la entrada sensorial. Por ejemplo, para determinar la sensibilidad de una persona a la luz tenue, se le presentaría al observador una serie de ensayos en los que una luz tenue estuviera aleatoriamente en la parte superior o inferior de la pantalla. Después de cada ensayo, el observador respondería "arriba" o "abajo". Al observador no se le permite decir "no sé", "no estoy seguro" o "no vi nada". En ese sentido, la elección del observador es forzada entre las dos alternativas.
Ambas opciones pueden presentarse simultáneamente (como en el ejemplo anterior) o secuencialmente en dos intervalos (también conocido como elección forzada en dos intervalos , 2IFC ). Por ejemplo, para determinar la sensibilidad a una luz tenue en un procedimiento de elección forzada en dos intervalos, se le podría presentar al observador una serie de ensayos que comprendan dos subensayos (intervalos) en los que la luz tenue se presente aleatoriamente en el primer o el segundo intervalo. Después de cada ensayo, el observador responde solo "primero" o "segundo".
El término 2AFC se utiliza a veces para describir una tarea en la que se presenta un único estímulo a un observador y debe elegir entre una de dos alternativas. Por ejemplo, en una tarea de decisión léxica, un participante observa una cadena de caracteres y debe responder si la cadena es una "palabra" o "no-palabra". Otro ejemplo es la tarea del kinetograma de puntos aleatorios, en la que un participante debe decidir si un grupo de puntos en movimiento se mueve predominantemente "hacia la izquierda" o "hacia la derecha". Los resultados de estas tareas, a veces llamadas tareas de sí-no, tienen muchas más probabilidades de verse afectados por diversos sesgos de respuesta que las tareas 2AFC. Por ejemplo, con luces extremadamente tenues, una persona puede responder, con total sinceridad, "no" (es decir, "no vi ninguna luz") en cada ensayo, mientras que los resultados de una tarea 2AFC mostrarán que la persona puede determinar de forma fiable la ubicación (arriba o abajo) de la misma luz extremadamente tenue.
2AFC es un método de psicofísica desarrollado por Gustav Theodor Fechner . [1]
Existen varias manipulaciones en el diseño de la tarea, diseñadas para probar dinámicas conductuales específicas de elección. En un experimento bien conocido de atención que examina el cambio de atención , la Tarea de Señalización de Posner utiliza un diseño 2AFC para presentar dos estímulos que representan dos ubicaciones dadas. [2] En este diseño hay una flecha que indica a qué estímulo (ubicación) prestar atención. La persona luego tiene que dar una respuesta entre los dos estímulos (ubicaciones) cuando se le indica. En animales, la tarea 2AFC se ha utilizado para probar el aprendizaje de probabilidad de refuerzo , por ejemplo, como elecciones en palomas después del refuerzo de ensayos. [3] También se ha diseñado una tarea 2AFC para probar la toma de decisiones y la interacción del aprendizaje de recompensa y probabilidad en monos. [4]
Se entrenó a los monos para que miraran un estímulo central y luego se les presentaron dos estímulos salientes uno al lado del otro. Luego se puede dar una respuesta en forma de sacudida hacia el estímulo izquierdo o derecho. Luego se administra una recompensa de jugo después de cada respuesta. Luego se varía la cantidad de jugo de recompensa para modular la elección.
En una aplicación diferente, el 2AFC está diseñado para probar la discriminación de la percepción del movimiento . La tarea de coherencia de movimiento de puntos aleatorios introduce un kinetograma de puntos aleatorios , con un porcentaje de movimiento coherente neto distribuido entre los puntos aleatorios . [5] [6] El porcentaje de puntos que se mueven juntos en una dirección dada determina la coherencia del movimiento hacia la dirección. En la mayoría de los experimentos, el participante debe realizar una respuesta de elección entre dos direcciones de movimiento (por ejemplo, hacia arriba o hacia abajo), generalmente indicada por una respuesta motora como un movimiento sacádico o presionar un botón.
Es posible introducir sesgos en la toma de decisiones en la tarea 2AFC. Por ejemplo, si un estímulo se presenta con mayor frecuencia que el otro, entonces la frecuencia de exposición a los estímulos puede influir en las creencias del participante sobre la probabilidad de ocurrencia de las alternativas. [4] [7] La introducción de sesgos en la tarea 2AFC se utiliza para modular la toma de decisiones y examinar los procesos subyacentes.
La tarea 2AFC ha producido resultados conductuales consistentes en la toma de decisiones, que conducen al desarrollo de modelos teóricos y computacionales de la dinámica y los resultados de la toma de decisiones. [8] [9] [10 ] [11] [12 ] [13] [14] [15] [16] [17]
Supongamos que los dos estímulos y en la tarea 2AFC son variables aleatorias de dos categorías diferentes y , y la tarea consiste en decidir cuál es cuál. Un modelo común es suponer que los estímulos provienen de distribuciones normales y . Bajo este modelo normal, la estrategia de decisión óptima (del observador ideal ) es decidir cuál de dos distribuciones normales bivariadas tiene más probabilidades de producir la tupla : las distribuciones conjuntas de y , o de y . [18]
La probabilidad de error con esta estrategia de decisión ideal viene dada por la distribución de chi-cuadrado generalizada : , donde
Este modelo también puede extenderse a los casos en que cada uno de los dos estímulos es en sí mismo un vector normal multivariado, y también a las situaciones en que las dos categorías tienen diferentes probabilidades previas, o las decisiones están sesgadas debido a diferentes valores asignados a los posibles resultados. [18]
Los modelos computacionales que utilizan el 2AFC suelen tener tres suposiciones :
i) la evidencia que favorece cada alternativa se integra a lo largo del tiempo; ii) el proceso está sujeto a fluctuaciones aleatorias ; y iii) la decisión se toma cuando se ha acumulado suficiente evidencia que favorece una alternativa sobre la otra.
— Bogacz et al., La física de la toma de decisiones óptima [7]
Generalmente se supone que la diferencia en la evidencia que favorece cada alternativa es la cantidad rastreada a lo largo del tiempo y la que en última instancia informa la decisión; sin embargo, la evidencia para diferentes alternativas podría rastrearse por separado. [7]
El modelo de difusión por deriva (DDM) es un modelo bien definido [19] , que se propone para implementar una política de decisión óptima para 2AFC. [20] Es el análogo continuo de un modelo de paseo aleatorio . [7] El DDM supone que en una tarea 2AFC, el sujeto acumula evidencia para una u otra de las alternativas en cada paso de tiempo e integra esa evidencia hasta que se alcanza un umbral de decisión. Como la entrada sensorial que constituye la evidencia es ruidosa, la acumulación hasta el umbral es estocástica en lugar de determinista , lo que da lugar al comportamiento dirigido similar al de un paseo aleatorio. Se ha demostrado que el DDM describe la precisión y los tiempos de reacción en datos humanos para tareas 2AFC. [13] [19]
La acumulación de pruebas en el DDM se rige según la siguiente fórmula:
[7]
En el momento cero, la evidencia acumulada, x, se establece igual a cero. En cada paso de tiempo, se acumula cierta evidencia, A, para una de las dos posibilidades en el 2AFC. A es positiva si la respuesta correcta está representada por el umbral superior, y negativa si es el inferior. Además, se agrega un término de ruido, cdW, para representar el ruido en la entrada. En promedio, el ruido se integrará a cero. [7] El DDM extendido [13] permite la selección de y el valor inicial de a partir de distribuciones separadas, lo que proporciona un mejor ajuste a los datos experimentales tanto para la precisión como para los tiempos de reacción. [21] [22]
El modelo de Ornstein-Uhlenbeck [14] extiende el DDM agregando otro término, , a la acumulación que depende de la acumulación actual de evidencia; esto tiene el efecto neto de aumentar la tasa de acumulación hacia la opción inicialmente preferida.
[7]
En el modelo de carrera, [11] [12] [23] la evidencia para cada alternativa se acumula por separado y se toma una decisión cuando uno de los acumuladores alcanza un umbral predeterminado o cuando se fuerza una decisión y luego se elige la decisión asociada con el acumulador con la evidencia más alta. Esto se puede representar formalmente por:
[7]
El modelo de carrera no es matemáticamente reducible al DDM, [7] y por lo tanto no se puede utilizar para implementar un procedimiento de decisión óptimo.
El modelo de inhibición mutua [16] también utiliza dos acumuladores para modelar la acumulación de evidencia, como en el modelo de carrera. En este modelo, los dos acumuladores tienen un efecto inhibidor entre sí, de modo que, a medida que se acumula evidencia en uno, se amortigua la acumulación de evidencia en el otro. Además, se utilizan acumuladores con fugas, de modo que con el tiempo la evidencia acumulada se desintegra; esto ayuda a prevenir la acumulación descontrolada hacia una alternativa basada en una serie corta de evidencia en una dirección. Formalmente, esto se puede mostrar como:
[7]
Donde es una tasa de decaimiento compartida de los acumuladores, y es la tasa de inhibición mutua.
El modelo de inhibición de retroalimentación [24] es similar al modelo de inhibición mutua, pero en lugar de ser inhibido por el valor actual del otro acumulador, cada acumulador es inhibido por una fracción de la entrada del otro. Se puede expresar formalmente de la siguiente manera:
[7]
¿Dónde está la fracción de entrada del acumulador que inhibe el acumulador alterno?
Wang [25] propuso el modelo de inhibición agrupada, en el que un tercer acumulador en decadencia es impulsado por la acumulación en ambos acumuladores utilizados para la toma de decisiones y, además de la decadencia utilizada en el modelo de inhibición mutua, cada uno de los acumuladores que impulsan la toma de decisiones se refuerza a sí mismo en función de su valor actual. Se puede expresar formalmente de la siguiente manera:
[7]
El tercer acumulador tiene un coeficiente de decaimiento independiente, , y aumenta en función de los valores actuales de los otros dos acumuladores, a una tasa modulada por .
En el lóbulo parietal , la tasa de activación de las neuronas de la corteza intraparietal lateral (LIP) en los monos predijo la respuesta de elección de la dirección del movimiento, lo que sugiere que esta área está involucrada en la toma de decisiones en el 2AFC. [4] [24] [26]
Los datos neuronales registrados de las neuronas LIP en monos rhesus respaldan la DDM, ya que las tasas de disparo para las poblaciones neuronales selectivas de dirección sensibles a las dos direcciones utilizadas en la tarea 2AFC aumentan las tasas de disparo al inicio del estímulo, y la actividad promedio en las poblaciones neuronales está sesgada en la dirección de la respuesta correcta. [24] [27] [28] [29] Además, parece que se utiliza un umbral fijo de tasa de disparo neuronal como límite de decisión para cada tarea 2AFC. [30]
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )