El test de Sally-Anne es un test psicológico concebido originalmente por Daniel Dennett, utilizado en psicología del desarrollo para medir la capacidad cognitiva social de una persona para atribuir creencias falsas a los demás. [1] Basado en el estudio pionero anterior de Wimmer y Perner (1983), [2] el test de Sally-Anne fue bautizado así por Simon Baron-Cohen , Alan M. Leslie y Uta Frith (1985), quienes desarrollaron aún más el test; [3] en 1988, Leslie y Frith repitieron el experimento con actores humanos (en lugar de muñecos) y encontraron resultados similares. [4]
Para desarrollar una prueba eficaz, Baron-Cohen et al. modificaron el paradigma del juego de títeres de Wimmer y Perner (1983), en el que los títeres representan personajes tangibles de una historia, en lugar de personajes hipotéticos de una narración pura.
En el proceso de prueba, después de presentar las muñecas, se le hace al niño la pregunta de control de recordar sus nombres (la pregunta de denominación ). Luego se representa una breve representación teatral: Sally toma una canica y la esconde en su canasta. Luego "sale" de la habitación y sale a caminar. Mientras está fuera, Anne saca la canica de la canasta de Sally y la coloca en su propia caja. Luego se vuelve a presentar a Sally y se le hace al niño la pregunta clave, la pregunta de creencia : "¿Dónde buscará Sally su canica?" [3]
En el estudio de Baron-Cohen, Leslie y Frith sobre la teoría de la mente en el autismo , 61 niños (20 de los cuales fueron diagnosticados con autismo según criterios establecidos, 14 con síndrome de Down y 27 de los cuales fueron determinados como clínicamente sanos ) fueron evaluados con "Sally" y "Anne". [3]
Para que un participante apruebe esta prueba, debe responder correctamente a la pregunta de creencias indicando que Sally cree que la canica está en su propia canasta. Esta respuesta es coherente con la perspectiva de Sally, pero no con la del participante. Si el participante no puede adoptar una perspectiva alternativa, indicará que Sally tiene motivos para creer, como él, que la canica se ha movido. Por lo tanto, aprobar la prueba se considera la manifestación de que el participante comprende que Sally tiene sus propias creencias que pueden no correlacionarse con la realidad; este es el requisito central de la teoría de la mente . [5]
En el estudio de Baron-Cohen et al. (1985), 23 de los 27 niños sin discapacidad clínica (85%) y 12 de los 14 niños con síndrome de Down (86%) respondieron correctamente a la pregunta sobre creencias . Sin embargo, sólo cuatro de los 20 niños con autismo (20%) respondieron correctamente. En general, los niños menores de cuatro años, junto con la mayoría de los niños autistas (de edades más avanzadas), respondieron a la pregunta sobre creencias con "la caja de Anne", aparentemente sin darse cuenta de que Sally no sabe que su canica ha sido movida. [3]
Aunque se ha afirmado que los datos de Baron-Cohen et al. indican una falta de teoría de la mente en los niños autistas, existen otros posibles factores que los afectan. Por ejemplo, los individuos autistas pueden aprobar la tarea de recordar, que es más sencilla desde el punto de vista cognitivo, pero los problemas de lenguaje, tanto en los niños autistas como en los controles sordos, tienden a confundir los resultados. [6]
Ruffman, Garnham y Rideout (2001) investigaron más a fondo los vínculos entre la prueba de Sally-Anne y el autismo en términos de la mirada como función comunicativa social. Añadieron una tercera ubicación posible para la canica: el bolsillo del investigador. Cuando se realizó la prueba en este formato a niños autistas y niños con discapacidades de aprendizaje moderadas, descubrieron que ambos grupos respondieron la pregunta sobre creencias igualmente bien; sin embargo, los participantes con discapacidades de aprendizaje moderadas miraron con fiabilidad la ubicación correcta de la canica, mientras que los participantes autistas no lo hicieron, incluso si el participante autista respondió la pregunta correctamente. [7] Estos resultados pueden ser una expresión de los déficits sociales relevantes para el autismo.
Tager-Flusberg (2007) afirma que, a pesar de los hallazgos empíricos con la prueba Sally-Anne, existe una creciente incertidumbre entre los científicos sobre la importancia de la hipótesis subyacente de la teoría de la mente en el autismo. En todos los estudios que se han realizado, algunos niños con autismo superan las pruebas de creencias falsas como la prueba Sally-Anne. [8]
El seguimiento ocular de chimpancés, bonobos y orangutanes sugiere que los tres anticipan las creencias falsas de un sujeto disfrazado de King Kong y pasan la prueba de Sally-Anne. [9] [10]
Los investigadores de la inteligencia artificial y la ciencia cognitiva computacional han intentado durante mucho tiempo modelar computacionalmente la capacidad humana para razonar sobre las creencias (falsas) de otros en tareas como la prueba de Sally-Anne. Se han adoptado muchos enfoques para replicar esta capacidad en las computadoras, incluidos los enfoques de redes neuronales, [11] el reconocimiento de planes epistémicos, [12] y la teoría de la mente bayesiana. [13] Estos enfoques suelen modelar a los agentes como seleccionando racionalmente acciones basadas en sus creencias y deseos, que pueden usarse para predecir sus acciones futuras (como en la prueba de Sally-Anne) o para inferir sus creencias y deseos actuales. En entornos restringidos, estos modelos pueden reproducir un comportamiento similar al humano en tareas similares a la prueba de Sally-Anne, siempre que las tareas se representen en un formato legible por máquina .
El 22 de marzo de 2023, un equipo de investigación de Microsoft publicó un artículo que mostraba que el sistema de IA basado en LLM GPT-4 podía pasar una instancia de la prueba de Sally-Anne, lo que los autores interpretan como "sugerir que GPT-4 tiene un nivel muy avanzado de teoría de la mente". [14] Sin embargo, la generalidad de este hallazgo ha sido cuestionada por varios otros artículos, que indican que la capacidad de GPT-4 para razonar sobre las creencias de otros agentes sigue siendo limitada (59% de precisión en el punto de referencia ToMi), [15] y no es robusta a los cambios "adversarios" en la prueba de Sally-Anne que los humanos manejan con flexibilidad. [16] [17] Si bien algunos autores argumentan que el desempeño de GPT-4 en tareas similares a Sally-Anne se puede aumentar al 100% a través de estrategias de indicaciones mejoradas, [18] este enfoque parece mejorar la precisión a solo el 73% en el conjunto de datos ToMi más grande. [16] En un trabajo relacionado, los investigadores han descubierto que los LLM no exhiben intuiciones similares a las humanas sobre los objetivos que otros agentes persiguen, [19] y que no producen de manera confiable inferencias graduadas sobre los objetivos de otros agentes a partir de acciones observadas. [20] Por lo tanto, el grado en el que los LLM como GPT-4 pueden realizar razonamiento social sigue siendo un área activa de investigación.
{{cite journal}}
: CS1 maint: nombres numéricos: lista de autores ( enlace ){{cite journal}}
: Requiere citar revista |journal=
( ayuda )