stringtranslate.com

Elección forzada entre dos alternativas

La elección forzada de dos alternativas ( 2AFC ) es un método para medir la sensibilidad de una persona o un animal a una determinada entrada sensorial, un estímulo , a través del patrón de elecciones de ese observador y los tiempos de respuesta a dos versiones de la entrada sensorial. Por ejemplo, para determinar la sensibilidad de una persona a la luz tenue, se le presentaría al observador una serie de ensayos en los que una luz tenue estuviera aleatoriamente en la parte superior o inferior de la pantalla. Después de cada ensayo, el observador respondería "arriba" o "abajo". Al observador no se le permite decir "no sé", "no estoy seguro" o "no vi nada". En ese sentido, la elección del observador es forzada entre las dos alternativas.

Ambas opciones pueden presentarse simultáneamente (como en el ejemplo anterior) o secuencialmente en dos intervalos (también conocido como elección forzada en dos intervalos , 2IFC ). Por ejemplo, para determinar la sensibilidad a una luz tenue en un procedimiento de elección forzada en dos intervalos, se le podría presentar al observador una serie de ensayos que comprendan dos subensayos (intervalos) en los que la luz tenue se presente aleatoriamente en el primer o el segundo intervalo. Después de cada ensayo, el observador responde solo "primero" o "segundo".

El término 2AFC se utiliza a veces para describir una tarea en la que se presenta un único estímulo a un observador y debe elegir entre una de dos alternativas. Por ejemplo, en una tarea de decisión léxica, un participante observa una cadena de caracteres y debe responder si la cadena es una "palabra" o "no-palabra". Otro ejemplo es la tarea del kinetograma de puntos aleatorios, en la que un participante debe decidir si un grupo de puntos en movimiento se mueve predominantemente "hacia la izquierda" o "hacia la derecha". Los resultados de estas tareas, a veces llamadas tareas de sí-no, tienen muchas más probabilidades de verse afectados por diversos sesgos de respuesta que las tareas 2AFC. Por ejemplo, con luces extremadamente tenues, una persona puede responder, con total sinceridad, "no" (es decir, "no vi ninguna luz") en cada ensayo, mientras que los resultados de una tarea 2AFC mostrarán que la persona puede determinar de forma fiable la ubicación (arriba o abajo) de la misma luz extremadamente tenue.

2AFC es un método de psicofísica desarrollado por Gustav Theodor Fechner . [1]

Experimentos de comportamiento

Existen varias manipulaciones en el diseño de la tarea, diseñadas para probar dinámicas conductuales específicas de elección. En un experimento bien conocido de atención que examina el cambio de atención , la Tarea de Señalización de Posner utiliza un diseño 2AFC para presentar dos estímulos que representan dos ubicaciones dadas. [2] En este diseño hay una flecha que indica a qué estímulo (ubicación) prestar atención. La persona luego tiene que dar una respuesta entre los dos estímulos (ubicaciones) cuando se le indica. En animales, la tarea 2AFC se ha utilizado para probar el aprendizaje de probabilidad de refuerzo , por ejemplo, como elecciones en palomas después del refuerzo de ensayos. [3] También se ha diseñado una tarea 2AFC para probar la toma de decisiones y la interacción del aprendizaje de recompensa y probabilidad en monos. [4]

Ejemplo de un kinetograma de puntos aleatorios utilizado en una tarea 2AFC.

Se entrenó a los monos para que miraran un estímulo central y luego se les presentaron dos estímulos salientes uno al lado del otro. Luego se puede dar una respuesta en forma de sacudida hacia el estímulo izquierdo o derecho. Luego se administra una recompensa de jugo después de cada respuesta. Luego se varía la cantidad de jugo de recompensa para modular la elección.

En una aplicación diferente, el 2AFC está diseñado para probar la discriminación de la percepción del movimiento . La tarea de coherencia de movimiento de puntos aleatorios introduce un kinetograma de puntos aleatorios , con un porcentaje de movimiento coherente neto distribuido entre los puntos aleatorios . [5] [6] El porcentaje de puntos que se mueven juntos en una dirección dada determina la coherencia del movimiento hacia la dirección. En la mayoría de los experimentos, el participante debe realizar una respuesta de elección entre dos direcciones de movimiento (por ejemplo, hacia arriba o hacia abajo), generalmente indicada por una respuesta motora como un movimiento sacádico o presionar un botón.

Sesgos en la toma de decisiones

Es posible introducir sesgos en la toma de decisiones en la tarea 2AFC. Por ejemplo, si un estímulo se presenta con mayor frecuencia que el otro, entonces la frecuencia de exposición a los estímulos puede influir en las creencias del participante sobre la probabilidad de ocurrencia de las alternativas. [4] [7] La ​​introducción de sesgos en la tarea 2AFC se utiliza para modular la toma de decisiones y examinar los procesos subyacentes.

Modelos de toma de decisiones

La tarea 2AFC ha producido resultados conductuales consistentes en la toma de decisiones, que conducen al desarrollo de modelos teóricos y computacionales de la dinámica y los resultados de la toma de decisiones. [8] [9] [10 ] [11] [12 ] [13] [14] [15] [16] [17]

Modelo de distribución normal

La estrategia óptima en una tarea 2AFC para estímulos normales univariados de categorías y es clasificar entre las dos distribuciones normales bivariadas conjuntas y . [18] La probabilidad de la elección correcta es 0,74 aquí.

Supongamos que los dos estímulos y en la tarea 2AFC son variables aleatorias de dos categorías diferentes y , y la tarea consiste en decidir cuál es cuál. Un modelo común es suponer que los estímulos provienen de distribuciones normales y . Bajo este modelo normal, la estrategia de decisión óptima (del observador ideal ) es decidir cuál de dos distribuciones normales bivariadas tiene más probabilidades de producir la tupla : las distribuciones conjuntas de y , o de y . [18]

La probabilidad de error con esta estrategia de decisión ideal viene dada por la distribución de chi-cuadrado generalizada : , donde

Este modelo también puede extenderse a los casos en que cada uno de los dos estímulos es en sí mismo un vector normal multivariado, y también a las situaciones en que las dos categorías tienen diferentes probabilidades previas, o las decisiones están sesgadas debido a diferentes valores asignados a los posibles resultados. [18]

Modelo de difusión por deriva

Los modelos computacionales que utilizan el 2AFC suelen tener tres suposiciones :

i) la evidencia que favorece cada alternativa se integra a lo largo del tiempo; ii) el proceso está sujeto a fluctuaciones aleatorias ; y iii) la decisión se toma cuando se ha acumulado suficiente evidencia que favorece una alternativa sobre la otra.

—  Bogacz et al., La física de la toma de decisiones óptima [7]

Generalmente se supone que la diferencia en la evidencia que favorece cada alternativa es la cantidad rastreada a lo largo del tiempo y la que en última instancia informa la decisión; sin embargo, la evidencia para diferentes alternativas podría rastrearse por separado. [7]

Ejemplo de seis secuencias de acumulación de evidencias a partir de una fuente imparcial (100 % de ruido). Las líneas punteadas indican los umbrales para la toma de decisiones para cada una de las dos alternativas.

El modelo de difusión por deriva (DDM) es un modelo bien definido [19] , que se propone para implementar una política de decisión óptima para 2AFC. [20] Es el análogo continuo de un modelo de paseo aleatorio . [7] El DDM supone que en una tarea 2AFC, el sujeto acumula evidencia para una u otra de las alternativas en cada paso de tiempo e integra esa evidencia hasta que se alcanza un umbral de decisión. Como la entrada sensorial que constituye la evidencia es ruidosa, la acumulación hasta el umbral es estocástica en lugar de determinista , lo que da lugar al comportamiento dirigido similar al de un paseo aleatorio. Se ha demostrado que el DDM describe la precisión y los tiempos de reacción en datos humanos para tareas 2AFC. [13] [19]

Modelo formal

Ejemplo de diez secuencias de acumulación de evidencias para el DDM, donde el resultado verdadero se asigna al umbral superior. Debido a la adición de ruido, dos secuencias han producido una decisión inexacta.

La acumulación de pruebas en el DDM se rige según la siguiente fórmula:

[7]

En el momento cero, la evidencia acumulada, x, se establece igual a cero. En cada paso de tiempo, se acumula cierta evidencia, A, para una de las dos posibilidades en el 2AFC. A es positiva si la respuesta correcta está representada por el umbral superior, y negativa si es el inferior. Además, se agrega un término de ruido, cdW, para representar el ruido en la entrada. En promedio, el ruido se integrará a cero. [7] El DDM extendido [13] permite la selección de y el valor inicial de a partir de distribuciones separadas, lo que proporciona un mejor ajuste a los datos experimentales tanto para la precisión como para los tiempos de reacción. [21] [22]

Otros modelos

Modelo de Ornstein-Uhlenbeck

El modelo de Ornstein-Uhlenbeck [14] extiende el DDM agregando otro término, , a la acumulación que depende de la acumulación actual de evidencia; esto tiene el efecto neto de aumentar la tasa de acumulación hacia la opción inicialmente preferida.

[7]

Modelo de carrera

En el modelo de carrera, [11] [12] [23] la evidencia para cada alternativa se acumula por separado y se toma una decisión cuando uno de los acumuladores alcanza un umbral predeterminado o cuando se fuerza una decisión y luego se elige la decisión asociada con el acumulador con la evidencia más alta. Esto se puede representar formalmente por:

[7]

El modelo de carrera no es matemáticamente reducible al DDM, [7] y por lo tanto no se puede utilizar para implementar un procedimiento de decisión óptimo.

Modelo de inhibición mutua

El modelo de inhibición mutua [16] también utiliza dos acumuladores para modelar la acumulación de evidencia, como en el modelo de carrera. En este modelo, los dos acumuladores tienen un efecto inhibidor entre sí, de modo que, a medida que se acumula evidencia en uno, se amortigua la acumulación de evidencia en el otro. Además, se utilizan acumuladores con fugas, de modo que con el tiempo la evidencia acumulada se desintegra; esto ayuda a prevenir la acumulación descontrolada hacia una alternativa basada en una serie corta de evidencia en una dirección. Formalmente, esto se puede mostrar como:

[7]

Donde es una tasa de decaimiento compartida de los acumuladores, y es la tasa de inhibición mutua.

Modelo de inhibición de retroalimentación

El modelo de inhibición de retroalimentación [24] es similar al modelo de inhibición mutua, pero en lugar de ser inhibido por el valor actual del otro acumulador, cada acumulador es inhibido por una fracción de la entrada del otro. Se puede expresar formalmente de la siguiente manera:

[7]

¿Dónde está la fracción de entrada del acumulador que inhibe el acumulador alterno?

Modelo de inhibición agrupada

Wang [25] propuso el modelo de inhibición agrupada, en el que un tercer acumulador en decadencia es impulsado por la acumulación en ambos acumuladores utilizados para la toma de decisiones y, además de la decadencia utilizada en el modelo de inhibición mutua, cada uno de los acumuladores que impulsan la toma de decisiones se refuerza a sí mismo en función de su valor actual. Se puede expresar formalmente de la siguiente manera:

[7]

El tercer acumulador tiene un coeficiente de decaimiento independiente, , y aumenta en función de los valores actuales de los otros dos acumuladores, a una tasa modulada por .

Correlatos neuronales de la toma de decisiones

Áreas del cerebro

En el lóbulo parietal , la tasa de activación de las neuronas de la corteza intraparietal lateral (LIP) en los monos predijo la respuesta de elección de la dirección del movimiento, lo que sugiere que esta área está involucrada en la toma de decisiones en el 2AFC. [4] [24] [26]

Los datos neuronales registrados de las neuronas LIP en monos rhesus respaldan la DDM, ya que las tasas de disparo para las poblaciones neuronales selectivas de dirección sensibles a las dos direcciones utilizadas en la tarea 2AFC aumentan las tasas de disparo al inicio del estímulo, y la actividad promedio en las poblaciones neuronales está sesgada en la dirección de la respuesta correcta. [24] [27] [28] [29] Además, parece que se utiliza un umbral fijo de tasa de disparo neuronal como límite de decisión para cada tarea 2AFC. [30]

Véase también

Referencias

  1. ^ Fechner, Gustav Theodor (1889). Elemente der Psychophysik (2 volúmenes) (2ª ed.). Leipzig: Breitkopf & Härtel.Volumen 2.
  2. ^ Posner, MI (febrero de 1980). "Orientación de la atención" (PDF) . Quarterly Journal of Experimental Psychology . 32 (1): 3–25. doi :10.1080/00335558008248231. ISSN  0033-555X. PMID  7367577. S2CID  2842391. Consultado el 12 de junio de 2012 .
  3. ^ Shimp, Charles P. (julio de 1966). "Conducta de elección reforzada probabilísticamente en palomas". Journal of the Experimental Analysis of Behavior . 9 (4): 443–455. doi :10.1901/jeab.1966.9-443. ISSN  0022-5002. PMC 1338246 . PMID  5961513. 
  4. ^ abc Platt, Michael L.; Paul W. Glimcher (15 de julio de 1999). "Correlaciones neuronales de las variables de decisión en la corteza parietal". Nature . 400 (6741): 233–238. Bibcode :1999Natur.400..233P. doi :10.1038/22268. ISSN  0028-0836. PMID  10421364. S2CID  4389701.
  5. ^ Britten, Kenneth H.; Michael N. Shadlen, William T. Newsome, J. Anthony Movshon (1993). "Respuestas de las neuronas en el mononucleosis infecciosa macaca a las señales de movimiento estocástico". Neurociencia visual . 10 (6): 1157–1169. doi :10.1017/S0952523800010269. PMID  8257671. S2CID  38024406.{{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
  6. ^ Gold, Joshua I.; Michael N. Shadlen (23 de marzo de 2000). "Representación de una decisión perceptiva en el desarrollo de órdenes oculomotoras". Nature . 404 (6776): 390–394. Bibcode :2000Natur.404..390G. doi :10.1038/35006062. ISSN  0028-0836. PMID  10746726. S2CID  4410921.
  7. ^ abcdefghijkl Bogacz, Rafal; Eric Brown, Jeff Moehlis, Philip Holmes, Jonathan D. Cohen (octubre de 2006). "La física de la toma de decisiones óptima: un análisis formal de los modelos de rendimiento en tareas de elección forzada con dos alternativas". Psychological Review . 113 (4): 700–765. CiteSeerX 10.1.1.212.9187 . doi :10.1037/0033-295x.113.4.700. ISSN  0033-295X. PMID  17014301 . Consultado el 9 de junio de 2012 . {{cite journal}}: CS1 maint: varios nombres: lista de autores ( enlace )
  8. ^ Stone, M. (1960). "Modelos para el tiempo de reacción de elección". Psychometrika . 25 (3): 251–260. doi :10.1007/bf02289729. S2CID  121644881.
  9. ^ Link, SW; RA Heath (1975). "Una teoría secuencial de la discriminación psicológica". Psychometrika . 40 (1): 77–105. doi :10.1007/bf02291481. S2CID  49042143.
  10. ^ Link, S. W (1975). "La teoría del juicio relativo del tiempo de respuesta de dos opciones". Revista de Psicología Matemática . 12 (1): 114–135. doi :10.1016/0022-2496(75)90053-x.
  11. ^ ab Pike, AR (1966). "Modelos estocásticos de comportamiento de elección: probabilidades de respuesta y latencias de sistemas de cadenas finitas de Markov1". British Journal of Mathematical and Statistical Psychology . 19 (1): 15–32. doi :10.1111/j.2044-8317.1966.tb00351.x. PMID  5939142.
  12. ^ ab Vickers, D. (1970). "Evidencia de un modelo acumulador de discriminación psicofísica". Ergonomía . 13 (1): 37–58. doi :10.1080/00140137008931117. PMID  5416868.
  13. ^ abc Ratcliff, R. (1978). "Una teoría de la recuperación de la memoria". Psychological Review . 85 (2): 59–108. doi :10.1037/0033-295x.85.2.59. S2CID  1166147.
  14. ^ ab Busemeyer, J. R; J. T Townsend (1993). "Teoría del campo de decisión: un enfoque cognitivo-dinámico para la toma de decisiones en un entorno incierto". Psychological Review . 100 (3): 432–459. doi :10.1037/0033-295x.100.3.432. PMID  8356185. S2CID  15604757.
  15. ^ Ratcliff, R.; T. Van Zandt, G. McKoon (1999). "Modelos conexionistas y de difusión del tiempo de reacción". Psychological Review . 106 (2): 261–300. doi :10.1037/0033-295x.106.2.261. PMID  10378014.
  16. ^ ab Usher, M.; J. L McClelland (2001). "El curso temporal de la elección perceptual: el modelo de acumulador competitivo y con fugas". Psychological Review . 108 (3): 550–592. doi :10.1037/0033-295x.108.3.550. PMID  11488378.
  17. ^ Ratcliff, R.; P. L Smith (2004). "Una comparación de modelos de muestreo secuencial para el tiempo de reacción de dos opciones". Psychological Review . 111 (2): 333–367. doi :10.1037/0033-295x.111.2.333. PMC 1440925 . PMID  15065913. 
  18. ^ abc Das, Abhranil; Geisler, Wilson (2021). "Un método para integrar y clasificar distribuciones normales". Journal of Vision . 21 (10): 1. arXiv : 2012.14331 . doi :10.1167/jov.21.10.1. PMC 8419883 . PMID  34468706. S2CID  229934512. 
  19. ^ ab Smith, P. L (2000). "Modelos dinámicos estocásticos de tiempo de respuesta y precisión: una introducción básica". Revista de psicología matemática . 44 (3): 408–463. doi :10.1006/jmps.1999.1260. PMID  10973778.
  20. ^ Laming, Donald Richard John (1968). Teoría de la información de los tiempos de reacción de elección . Academic P.
  21. ^ Ratcliff, R.; J. N Rouder (1998). "Modelado de tiempos de respuesta para decisiones de dos opciones". Psychological Science . 9 (5): 347–356. doi :10.1111/1467-9280.00067. S2CID  1045352.
  22. ^ Ratcliff, R.; J. N Rouder (2000). "Una explicación del modelo de difusión del enmascaramiento en la identificación de letras de dos opciones". Revista de Psicología Experimental: Percepción y Rendimiento Humano . 26 (1): 127–140. doi :10.1037/0096-1523.26.1.127. PMID  10696609.
  23. ^ LaBerge, D. (1962). "Una teoría de reclutamiento del comportamiento simple". Psychometrika . 27 (4): 375–396. doi :10.1007/bf02289645. S2CID  120502141.
  24. ^ abc Shadlen, MN; WT Newsome (23 de enero de 1996). "Percepción del movimiento: ver y decidir". Actas de la Academia Nacional de Ciencias . 93 (2): 628–633. Bibcode :1996PNAS...93..628S. doi : 10.1073/pnas.93.2.628 . ISSN  1091-6490. PMC 40102 . PMID  8570606. 
  25. ^ Wang, X. J (2002). "Toma de decisiones probabilística mediante reverberación lenta en circuitos corticales". Neuron . 36 (5): 955–968. doi : 10.1016/s0896-6273(02)01092-9 . PMID  12467598.
  26. ^ Shadlen, Michael N.; William T. Newsome (1 de octubre de 2001). "Base neural de una decisión perceptiva en la corteza parietal (área LIP) del mono Rhesus". Revista de neurofisiología . 86 (4): 1916–1936. doi :10.1152/jn.2001.86.4.1916. ISSN  1522-1598. PMID  11600651. S2CID  272332.
  27. ^ Hanes, D. P; J. D Schall (1996). "Control neuronal de la iniciación del movimiento voluntario". Science . 274 (5286): 427–430. Bibcode :1996Sci...274..427H. CiteSeerX 10.1.1.408.5678 . doi :10.1126/science.274.5286.427. PMID  8832893. S2CID  11202961. 
  28. ^ Schall, J. D; K. G Thompson (1999). "Selección y control neuronal de los movimientos oculares guiados visualmente". Revisión anual de neurociencia . 22 (1): 241–259. doi :10.1146/annurev.neuro.22.1.241. PMID  10202539. S2CID  1851931.
  29. ^ Gold, J. I; M. N Shadlen (2002). "Banburismo y el cerebro: decodificando la relación entre estímulos sensoriales, decisiones y recompensa". Neuron . 36 (2): 299–308. doi : 10.1016/s0896-6273(02)00971-6 . PMID  12383783.
  30. ^ Roitman, J. D; M. N Shadlen (2002). "Respuesta de las neuronas en el área intraparietal lateral durante una tarea de tiempo de reacción de discriminación visual combinada". The Journal of Neuroscience . 22 (21): 9475–9489. doi :10.1523/JNEUROSCI.22-21-09475.2002. PMC 6758024 . PMID  12417672.