stringtranslate.com

Elección forzada de dos alternativas

La elección forzada de dos alternativas ( 2AFC ) es un método para medir la sensibilidad de una persona o animal a algún estímulo o información sensorial particular , a través del patrón de elecciones y tiempos de respuesta de ese observador a dos versiones de la información sensorial. Por ejemplo, para determinar la sensibilidad de una persona a la luz tenue, al observador se le presentaban una serie de pruebas en las que una luz tenue se encontraba aleatoriamente en la parte superior o inferior de la pantalla. Después de cada prueba, el observador responde "arriba" o "abajo". Al observador no se le permite decir "no sé", "no estoy seguro" o "no vi nada". En ese sentido, la elección del observador se ve obligada entre las dos alternativas.

Ambas opciones se pueden presentar simultáneamente (como en el ejemplo anterior) o secuencialmente en dos intervalos (también conocido como elección forzada de dos intervalos , 2IFC ). Por ejemplo, para determinar la sensibilidad a una luz tenue en un procedimiento de elección forzada de dos intervalos, se podrían presentar a un observador una serie de pruebas que comprendan dos subensayos (intervalos) en los que la luz tenue se presenta aleatoriamente en el primero o en el segundo. intervalo. Después de cada intento, el observador responde sólo "primero" o "segundo".

El término 2AFC a menudo se utiliza erróneamente para describir una tarea de sí o no , en la que a un observador se le presentan una serie de pruebas en las que un estímulo se presenta aleatoriamente en algunas pruebas y no en otras. El observador responde después de cada ensayo sólo con "sí" o "no". Es mucho más probable que los resultados de una tarea de sí o no se vean afectados por diversos sesgos de respuesta que las tareas 2AFC. Por ejemplo, con luces extremadamente tenues, una persona podría responder, con toda sinceridad, "no" (es decir, "no vi ninguna luz") en cada prueba, mientras que los resultados de una tarea 2AFC mostrarán que la persona puede determinar de manera confiable la Ubicación (arriba o abajo) de la misma, luz extremadamente tenue.

2AFC es un método de psicofísica desarrollado por Gustav Theodor Fechner . [1]

La situación se complica por el hecho de que las tareas 2AFC también se utilizan ampliamente para tareas de discriminación. En lugar de detectar un estímulo, se le indica al observador que discrimine entre dos estímulos alternativos. Esto puede interpretarse como un problema de detección de señales (detectar la diferencia entre los dos estímulos). El procedimiento 2AFC, por tanto, también permite estimar el desempeño de discriminación objetiva insesgada, como la diferencia más pequeña entre los estímulos que el observador puede distinguir. Sin embargo, estas tareas de discriminación también se utilizan a menudo para hacer inferencias sobre lo que se conoce como el punto de igualdad subjetiva, el nivel de estímulo en el que los observadores adivinan entre las dos opciones al 50%. Esto se toma como la diferencia de estímulo cuando los dos estímulos parecen iguales, por ejemplo, en efectos contextuales como la ilusión de inclinación . Se recomienda precaución en este escenario porque, a diferencia de medir el umbral de discriminación objetiva, juzgar la apariencia de un estímulo puede estar sujeto a sesgos de respuesta , al igual que una tarea de sí o no , aunque el procedimiento esté diseñado como una tarea 2AFC. [2]

Experimentos de comportamiento

Hay varias manipulaciones en el diseño de la tarea, diseñadas para probar dinámicas de comportamiento específicas de elección. En un conocido experimento de atención que examina el cambio de atención , la Tarea de Señales de Posner utiliza un diseño 2AFC para presentar dos estímulos que representan dos ubicaciones determinadas. [3] En este diseño hay una flecha que indica a qué estímulo (ubicación) prestar atención. Luego, la persona tiene que dar una respuesta entre los dos estímulos (ubicaciones) cuando se le solicite. En animales, la tarea 2AFC se ha utilizado para probar el aprendizaje de probabilidad de refuerzo , por ejemplo, como las elecciones en palomas después del refuerzo de las pruebas. [4] También se ha diseñado una tarea 2AFC para probar la toma de decisiones y la interacción de la recompensa y el aprendizaje de probabilidad en monos. [5]

Ejemplo de un cinetograma de puntos aleatorios utilizado en una tarea 2AFC.

Se entrenó a los monos para que miraran un estímulo central y luego se les presentaron dos estímulos destacados uno al lado del otro. Luego se puede dar una respuesta en forma de sacádica hacia el estímulo izquierdo o derecho. Luego se administra una recompensa de jugo después de cada respuesta. Luego, la cantidad de recompensa de jugo varía para modular la elección.

En una aplicación diferente, el 2AFC está diseñado para probar la discriminación de la percepción del movimiento . La tarea de coherencia del movimiento de puntos aleatorios introduce un cinetograma de puntos aleatorios , con un porcentaje de movimiento coherente neto distribuido entre los puntos aleatorios . [6] [7] El porcentaje de puntos que se mueven juntos en una dirección determinada determina la coherencia del movimiento hacia la dirección. En la mayoría de los experimentos, el participante debe elegir una respuesta entre dos direcciones de movimiento (por ejemplo, arriba o abajo), generalmente indicada por una respuesta motora como una sacudida o presionar un botón.

Sesgos en la toma de decisiones

Es posible introducir sesgos en la toma de decisiones en la tarea 2AFC. Por ejemplo, si un estímulo ocurre con más frecuencia que el otro, entonces la frecuencia de exposición a los estímulos puede influir en las creencias del participante sobre la probabilidad de que ocurran las alternativas. [5] [8] La introducción de sesgos en la tarea 2AFC se utiliza para modular la toma de decisiones y examinar los procesos subyacentes.

Modelos de toma de decisiones

La tarea 2AFC ha arrojado resultados conductuales consistentes en la toma de decisiones, que conducen al desarrollo de modelos teóricos y computacionales de la dinámica y los resultados de la toma de decisiones. [9] [10] [11] [12] [13] [14] [15] [16] [17] [18]

Modelo de distribución normal

La estrategia óptima en una tarea 2AFC para estímulos normales univariados de categorías y es clasificar entre las dos distribuciones normales bivariadas conjuntas y . [19] La probabilidad de la elección correcta es aquí de 0,74.

Supongamos que los dos estímulos y en la tarea 2AFC son variables aleatorias de dos categorías diferentes y y la tarea es decidir cuál era cuál. Un modelo común es suponer que los estímulos provienen de distribuciones normales y . Bajo este modelo normal, la estrategia de decisión óptima (del observador ideal ) es decidir cuál de dos distribuciones normales bivariadas es más probable que produzca la tupla : las distribuciones conjuntas de y , o de y . [19]

La probabilidad de error con esta estrategia de decisión ideal viene dada por la distribución chi-cuadrado generalizada : , donde

Este modelo también puede extenderse a los casos en los que cada uno de los dos estímulos es en sí mismo un vector normal multivariado, y también a las situaciones en las que las dos categorías tienen diferentes probabilidades previas, o las decisiones están sesgadas debido a diferentes valores asignados a los posibles resultados. [19]

Modelo de deriva-difusión

Normalmente , los modelos computacionales que utilizan el 2AFC hacen tres suposiciones :

i) la evidencia a favor de cada alternativa se integra a lo largo del tiempo; ii) el proceso está sujeto a fluctuaciones aleatorias ; y iii) la decisión se toma cuando se ha acumulado evidencia suficiente que favorece una alternativa sobre la otra.

—  Bogacz et al., La física de la toma de decisiones óptima [8]

Generalmente se supone que la diferencia en la evidencia que favorece a cada alternativa es la cantidad rastreada a lo largo del tiempo y lo que en última instancia informa la decisión; sin embargo, la evidencia de diferentes alternativas podría rastrearse por separado. [8]

Ejemplo de seis secuencias de acumulación de evidencia de una fuente imparcial (100% ruido). Las líneas punteadas indican los umbrales para la toma de decisiones para cada una de las dos alternativas.

El modelo de deriva-difusión (DDM) es un modelo bien definido [20] que se propone implementar una política de decisión óptima para 2AFC. [21] Es el análogo continuo de un modelo de paseo aleatorio . [8] El DDM supone que en una tarea 2AFC, el sujeto está acumulando evidencia para una u otra de las alternativas en cada paso de tiempo, e integrando esa evidencia hasta que se alcanza un umbral de decisión. Como la información sensorial que constituye la evidencia es ruidosa, la acumulación hasta el umbral es estocástica en lugar de determinista ; esto da lugar a un comportamiento similar a un paseo aleatorio dirigido. Se ha demostrado que el DDM describe la precisión y los tiempos de reacción en datos humanos para tareas 2AFC. [14] [20]

modelo formal

Ejemplo de diez secuencias de acumulación de evidencia para el DDM, donde el resultado verdadero se asigna al umbral superior. Debido a la adición de ruido, dos secuencias han producido una decisión inexacta.

La acumulación de pruebas en el DDM se rige según la siguiente fórmula:

[8]

En el momento cero, la evidencia acumulada, x, se iguala a cero. En cada paso de tiempo, se acumula alguna evidencia, A, para una de las dos posibilidades en el 2AFC. A es positiva si la respuesta correcta está representada por el umbral superior y negativa si es el inferior. Además, se agrega un término de ruido, cdW, para representar el ruido en la entrada. En promedio, el ruido se integrará a cero. [8] El DDM extendido [14] permite la selección y el valor inicial de distribuciones separadas; esto proporciona un mejor ajuste a los datos experimentales tanto en términos de precisión como de tiempos de reacción. [22] [23]

Otros modelos

Modelo de Ornstein-Uhlenbeck

El modelo de Ornstein-Uhlenbeck [15] extiende el DDM agregando otro término, , a la acumulación que depende de la acumulación actual de evidencia; esto tiene el efecto neto de aumentar la tasa de acumulación hacia la opción inicialmente preferida.

[8]

modelo de carrera

En el modelo de carrera, [12] [13] [24] la evidencia para cada alternativa se acumula por separado y se toma una decisión cuando uno de los acumuladores alcanza un umbral predeterminado, o cuando se fuerza una decisión y luego se toma la decisión asociada con la alternativa. Se elige el acumulador con mayor evidencia. Esto se puede representar formalmente por:

[8]

El modelo de carrera no es matemáticamente reducible al DDM [8] y, por lo tanto, no puede usarse para implementar un procedimiento de decisión óptimo.

Modelo de inhibición mutua

El modelo de inhibición mutua [17] también utiliza dos acumuladores para modelar la acumulación de evidencia, como ocurre con el modelo racial. En este modelo, los dos acumuladores tienen un efecto inhibidor entre sí, de modo que cuando la evidencia se acumula en uno, amortigua la acumulación de evidencia en el otro. Además, se utilizan acumuladores con fugas, de modo que con el tiempo la evidencia acumulada se desintegra; esto ayuda a evitar una acumulación descontrolada hacia una alternativa basada en una corta serie de evidencia en una dirección. Formalmente, esto se puede mostrar como:

[8]

Donde es la tasa de desintegración compartida de los acumuladores y es la tasa de inhibición mutua.

Modelo de inhibición anticipada

El modelo de inhibición anticipada [25] es similar al modelo de inhibición mutua, pero en lugar de ser inhibido por el valor actual del otro acumulador, cada acumulador es inhibido por una fracción de la entrada al otro. Se puede expresar formalmente así:

[8]

¿Dónde está la fracción de entrada del acumulador que inhibe el acumulador alternativo?

Modelo de inhibición agrupada

Wang [26] sugirió el modelo de inhibición agrupada, donde un tercer acumulador en decadencia es impulsado por la acumulación en ambos acumuladores utilizados para la toma de decisiones, y además de la decadencia utilizada en el modelo de inhibición mutua, cada uno de los acumuladores que impulsan las decisiones se autodeterminan. -reforzar en función de su valor actual. Se puede expresar formalmente así:

[8]

El tercer acumulador tiene un coeficiente de caída independiente, y aumenta en función de los valores actuales de los otros dos acumuladores, a una velocidad modulada por .

Correlatos neuronales de la toma de decisiones.

Áreas del cerebro

En el lóbulo parietal , la velocidad de activación de las neuronas de la corteza intraparietal lateral (LIP) en monos predijo la respuesta de elección de la dirección del movimiento, lo que sugiere que esta área está involucrada en la toma de decisiones en el 2AFC. [5] [25] [27]

Los datos neuronales registrados de las neuronas LIP en monos rhesus respaldan el DDM, ya que las tasas de activación para la dirección selectiva de las poblaciones neuronales sensibles a las dos direcciones utilizadas en la tarea 2AFC aumentan las tasas de activación al inicio del estímulo, y la actividad promedio en las poblaciones neuronales está sesgada en el dirección de la respuesta correcta. [25] [28] [29] [30] Además, parece que se utiliza un umbral fijo de tasa de picos neuronales como límite de decisión para cada tarea 2AFC. [31]

Ver también

Referencias

  1. ^ Fechner, Gustav Theodor (1889). Elemente der Psychophysik (2 volúmenes) (2ª ed.). Leipzig: Breitkopf & Härtel.Vol 2.
  2. ^ Morgan, M., Dillenburger, B., Raphael, S., Solomon, JA (enero de 2012). "Los observadores pueden cambiar voluntariamente sus funciones psicométricas sin perder sensibilidad". Atención, Percepción y Psicofísica . 74 (1): 185-193. doi :10.3758/s13414-011-0222-7. ISSN  1943-393X. PMC 3264850 . PMID  22033949. 
  3. ^ Posner, MI (febrero de 1980). «Orientación de la atención» (PDF) . Revista Trimestral de Psicología Experimental . 32 (1): 3–25. doi : 10.1080/00335558008248231. ISSN  0033-555X. PMID  7367577. S2CID  2842391 . Consultado el 12 de junio de 2012 .
  4. ^ Shimp, Charles P. (julio de 1966). "Comportamiento de elección reforzado probabilísticamente en palomas". Revista de Análisis Experimental del Comportamiento . 9 (4): 443–455. doi :10.1901/jeab.1966.9-443. ISSN  0022-5002. PMC 1338246 . PMID  5961513. 
  5. ^ abc Platt, Michael L.; Paul W. Glimcher (15 de julio de 1999). "Correlaciones neuronales de variables de decisión en la corteza parietal". Naturaleza . 400 (6741): 233–238. Código Bib :1999Natur.400..233P. doi :10.1038/22268. ISSN  0028-0836. PMID  10421364. S2CID  4389701.
  6. ^ Britten, Kenneth H.; Michael N. Shadlen, William T. Newsome, J. Anthony Movshon (1993). "Respuestas de las neuronas en macaco MT a señales de movimiento estocástico". Neurociencia Visual . 10 (6): 1157-1169. doi :10.1017/S0952523800010269. PMID  8257671. S2CID  38024406.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  7. ^ Oro, Josué I.; Michael N. Shadlen (23 de marzo de 2000). "Representación de una decisión perceptual en el desarrollo de comandos oculomotores". Naturaleza . 404 (6776): 390–394. Código Bib :2000Natur.404..390G. doi :10.1038/35006062. ISSN  0028-0836. PMID  10746726. S2CID  4410921.
  8. ^ abcdefghijkl Bogacz, Rafal; Eric Brown, Jeff Moehlis, Philip Holmes, Jonathan D. Cohen (octubre de 2006). "La física de la toma de decisiones óptima: un análisis formal de modelos de desempeño en tareas de elección forzada de dos alternativas". Revisión psicológica . 113 (4): 700–765. CiteSeerX 10.1.1.212.9187 . doi :10.1037/0033-295x.113.4.700. ISSN  0033-295X. PMID  17014301 . Consultado el 9 de junio de 2012 . {{cite journal}}: CS1 maint: multiple names: authors list (link)
  9. ^ Piedra, M. (1960). "Modelos de elección-tiempo de reacción". Psicometrika . 25 (3): 251–260. doi :10.1007/bf02289729. S2CID  121644881.
  10. ^ Enlace, SO; RA Heath (1975). "Una teoría secuencial de la discriminación psicológica". Psicometrika . 40 (1): 77-105. doi :10.1007/bf02291481. S2CID  49042143.
  11. ^ Enlace, SW (1975). "La teoría del juicio relativo del tiempo de respuesta de dos opciones". Revista de Psicología Matemática . 12 (1): 114-135. doi :10.1016/0022-2496(75)90053-x.
  12. ^ ab Pike, AR (1966). "Modelos estocásticos de comportamiento de elección: probabilidades de respuesta y latencias de sistemas de cadenas finitas de Markov1". Revista británica de psicología matemática y estadística . 19 (1): 15–32. doi :10.1111/j.2044-8317.1966.tb00351.x. PMID  5939142.
  13. ^ ab Vickers, D. (1970). "Evidencia de un modelo acumulador de discriminación psicofísica". Ergonomía . 13 (1): 37–58. doi : 10.1080/00140137008931117. PMID  5416868.
  14. ^ a b C Ratcliff, R. (1978). "Una teoría de la recuperación de la memoria". Revisión psicológica . 85 (2): 59-108. doi :10.1037/0033-295x.85.2.59. S2CID  1166147.
  15. ^ ab Busemeyer, J. R; JT Townsend (1993). "Teoría del campo de decisión: un enfoque dinámico-cognitivo para la toma de decisiones en un entorno incierto". Revisión psicológica . 100 (3): 432–459. doi :10.1037/0033-295x.100.3.432. PMID  8356185. S2CID  15604757.
  16. ^ Ratcliff, R.; T. Van Zandt, G. McKoon (1999). "Modelos conexionistas y de difusión del tiempo de reacción". Revisión psicológica . 106 (2): 261–300. doi :10.1037/0033-295x.106.2.261. PMID  10378014.
  17. ^ ab Usher, M.; JL McClelland (2001). "El curso temporal de la elección perceptiva: el modelo de acumulador competitivo y con fugas". Revisión psicológica . 108 (3): 550–592. doi :10.1037/0033-295x.108.3.550. PMID  11488378.
  18. ^ Ratcliff, R.; PL Smith (2004). "Una comparación de modelos de muestreo secuencial para tiempo de reacción de dos opciones". Revisión psicológica . 111 (2): 333–367. doi :10.1037/0033-295x.111.2.333. PMC 1440925 . PMID  15065913. 
  19. ^ abcDas , Abhranil; Geisler, Wilson (2021). "Un método para integrar y clasificar distribuciones normales". Revista de Visión . 21 (10): 1. arXiv : 2012.14331 . doi :10.1167/jov.21.10.1. PMID  34468706. S2CID  229934512.
  20. ^ ab Smith, PL (2000). "Modelos dinámicos estocásticos de tiempo de respuesta y precisión: una introducción fundamental". Revista de Psicología Matemática . 44 (3): 408–463. doi :10.1006/jmps.1999.1260. PMID  10973778.
  21. ^ Laming, Donald Richard John (1968). Teoría de la información de los tiempos de elección-reacción . Académico P.
  22. ^ Ratcliff, R.; JN Rouder (1998). "Modelado de tiempos de respuesta para decisiones de dos opciones". Ciencia psicológica . 9 (5): 347–356. doi :10.1111/1467-9280.00067. S2CID  1045352.
  23. ^ Ratcliff, R.; JN Rouder (2000). "Un modelo de difusión del enmascaramiento en la identificación de letras de dos opciones". Revista de Psicología Experimental: Percepción y desempeño humanos . 26 (1): 127–140. doi :10.1037/0096-1523.26.1.127. PMID  10696609.
  24. ^ LaBerge, D. (1962). "Una teoría del reclutamiento de comportamiento simple". Psicometrika . 27 (4): 375–396. doi :10.1007/bf02289645. S2CID  120502141.
  25. ^ abc Shadlen, MN; Peso Newsome (23 de enero de 1996). "Percepción del movimiento: ver y decidir". Procedimientos de la Academia Nacional de Ciencias . 93 (2): 628–633. Código bibliográfico : 1996PNAS...93..628S. doi : 10.1073/pnas.93.2.628 . ISSN  1091-6490. PMC 40102 . PMID  8570606. 
  26. ^ Wang, XJ (2002). "Toma de decisiones probabilística por reverberación lenta en circuitos corticales". Neurona . 36 (5): 955–968. doi : 10.1016/s0896-6273(02)01092-9 . PMID  12467598.
  27. ^ Shadlen, Michael N.; William T. Newsome (1 de octubre de 2001). "Base neuronal de una decisión perceptual en la corteza parietal (área LIP) del mono Rhesus". Revista de Neurofisiología . 86 (4): 1916-1936. doi : 10.1152/junio de 2001.86.4.1916. ISSN  1522-1598. PMID  11600651. S2CID  272332.
  28. ^ Hanes, DP; JD Schall (1996). "Control neuronal de la iniciación del movimiento voluntario". Ciencia . 274 (5286): 427–430. Código Bib : 1996 Ciencia... 274.. 427H. CiteSeerX 10.1.1.408.5678 . doi : 10.1126/ciencia.274.5286.427. PMID  8832893. S2CID  11202961. 
  29. ^ Schall, JD; KG Thompson (1999). "Selección neuronal y control de movimientos oculares guiados visualmente". Revista Anual de Neurociencia . 22 (1): 241–259. doi :10.1146/annurev.neuro.22.1.241. PMID  10202539. S2CID  1851931.
  30. ^ Oro, JI; MN Shadlen (2002). "Banburismus y el cerebro: decodificando la relación entre estímulos sensoriales, decisiones y recompensa". Neurona . 36 (2): 299–308. doi : 10.1016/s0896-6273(02)00971-6 . PMID  12383783.
  31. ^ Roitman, JD; MN Shadlen (2002). "Respuesta de las neuronas del área intraparietal lateral durante una tarea combinada de tiempo de reacción de discriminación visual". La Revista de Neurociencia . 22 (21): 9475–9489. doi :10.1523/JNEUROSCI.22-21-09475.2002. PMC 6758024 . PMID  12417672.