Prueba de Sally-Anne

El test de Sally-Anne es un test psicológico concebido originalmente por Daniel Dennett, utilizado en psicología del desarrollo para medir la capacidad cognitiva social de una persona para atribuir creencias falsas a los demás. ^[1] Basado en el estudio pionero anterior de Wimmer y Perner (1983), ^[2] el test de Sally-Anne fue bautizado así por Simon Baron-Cohen , Alan M. Leslie y Uta Frith (1985), quienes desarrollaron aún más el test; ^[3] en 1988, Leslie y Frith repitieron el experimento con actores humanos (en lugar de muñecos) y encontraron resultados similares. ^[4]

Descripción de la prueba

Para desarrollar una prueba eficaz, Baron-Cohen et al. modificaron el paradigma del juego de títeres de Wimmer y Perner (1983), en el que los títeres representan personajes tangibles de una historia, en lugar de personajes hipotéticos de una narración pura.

En el proceso de prueba, después de presentar las muñecas, se le hace al niño la pregunta de control de recordar sus nombres (la pregunta de denominación ). Luego se representa una breve representación teatral: Sally toma una canica y la esconde en su canasta. Luego "sale" de la habitación y sale a caminar. Mientras está fuera, Anne saca la canica de la canasta de Sally y la coloca en su propia caja. Luego se vuelve a presentar a Sally y se le hace al niño la pregunta clave, la pregunta de creencia : "¿Dónde buscará Sally su canica?" ^[3]

En el estudio de Baron-Cohen, Leslie y Frith sobre la teoría de la mente en el autismo , 61 niños (20 de los cuales fueron diagnosticados con autismo según criterios establecidos, 14 con síndrome de Down y 27 de los cuales fueron determinados como clínicamente sanos ) fueron evaluados con "Sally" y "Anne". ^[3]

Resultados

Para que un participante apruebe esta prueba, debe responder correctamente a la pregunta de creencias indicando que Sally cree que la canica está en su propia canasta. Esta respuesta es coherente con la perspectiva de Sally, pero no con la del participante. Si el participante no puede adoptar una perspectiva alternativa, indicará que Sally tiene motivos para creer, como él, que la canica se ha movido. Por lo tanto, aprobar la prueba se considera la manifestación de que el participante comprende que Sally tiene sus propias creencias que pueden no correlacionarse con la realidad; este es el requisito central de la teoría de la mente . ^[5]

En el estudio de Baron-Cohen et al. (1985), 23 de los 27 niños sin discapacidad clínica (85%) y 12 de los 14 niños con síndrome de Down (86%) respondieron correctamente a la pregunta sobre creencias . Sin embargo, sólo cuatro de los 20 niños con autismo (20%) respondieron correctamente. En general, los niños menores de cuatro años, junto con la mayoría de los niños autistas (de edades más avanzadas), respondieron a la pregunta sobre creencias con "la caja de Anne", aparentemente sin darse cuenta de que Sally no sabe que su canica ha sido movida. ^[3]

Crítica

Aunque se ha afirmado que los datos de Baron-Cohen et al. indican una falta de teoría de la mente en los niños autistas, existen otros posibles factores que los afectan. Por ejemplo, los individuos autistas pueden aprobar la tarea de recordar, que es más sencilla desde el punto de vista cognitivo, pero los problemas de lenguaje, tanto en los niños autistas como en los controles sordos, tienden a confundir los resultados. ^[6]

Ruffman, Garnham y Rideout (2001) investigaron más a fondo los vínculos entre la prueba de Sally-Anne y el autismo en términos de la mirada como función comunicativa social. Añadieron una tercera ubicación posible para la canica: el bolsillo del investigador. Cuando se realizó la prueba en este formato a niños autistas y niños con discapacidades de aprendizaje moderadas, descubrieron que ambos grupos respondieron la pregunta sobre creencias igualmente bien; sin embargo, los participantes con discapacidades de aprendizaje moderadas miraron con fiabilidad la ubicación correcta de la canica, mientras que los participantes autistas no lo hicieron, incluso si el participante autista respondió la pregunta correctamente. ^[7] Estos resultados pueden ser una expresión de los déficits sociales relevantes para el autismo.

Tager-Flusberg (2007) afirma que, a pesar de los hallazgos empíricos con la prueba Sally-Anne, existe una creciente incertidumbre entre los científicos sobre la importancia de la hipótesis subyacente de la teoría de la mente en el autismo. En todos los estudios que se han realizado, algunos niños con autismo superan las pruebas de creencias falsas como la prueba Sally-Anne. ^[8]

En otros homínidos

El seguimiento ocular de chimpancés, bonobos y orangutanes sugiere que los tres anticipan las creencias falsas de un sujeto disfrazado de King Kong y pasan la prueba de Sally-Anne. ^[9]^[10]

Inteligencia artificial

Los investigadores de la inteligencia artificial y la ciencia cognitiva computacional han intentado durante mucho tiempo modelar computacionalmente la capacidad humana para razonar sobre las creencias (falsas) de otros en tareas como la prueba de Sally-Anne. Se han adoptado muchos enfoques para replicar esta capacidad en las computadoras, incluidos los enfoques de redes neuronales, ^[11] el reconocimiento de planes epistémicos, ^[12] y la teoría de la mente bayesiana. ^[13] Estos enfoques suelen modelar a los agentes como seleccionando racionalmente acciones basadas en sus creencias y deseos, que pueden usarse para predecir sus acciones futuras (como en la prueba de Sally-Anne) o para inferir sus creencias y deseos actuales. En entornos restringidos, estos modelos pueden reproducir un comportamiento similar al humano en tareas similares a la prueba de Sally-Anne, siempre que las tareas se representen en un formato legible por máquina .

El 22 de marzo de 2023, un equipo de investigación de Microsoft publicó un artículo que mostraba que el sistema de IA basado en LLM GPT-4 podía pasar una instancia de la prueba de Sally-Anne, lo que los autores interpretan como "sugerir que GPT-4 tiene un nivel muy avanzado de teoría de la mente". ^[14] Sin embargo, la generalidad de este hallazgo ha sido cuestionada por varios otros artículos, que indican que la capacidad de GPT-4 para razonar sobre las creencias de otros agentes sigue siendo limitada (59% de precisión en el punto de referencia ToMi), ^[15] y no es robusta a los cambios "adversarios" en la prueba de Sally-Anne que los humanos manejan con flexibilidad. ^[16]^[17] Si bien algunos autores argumentan que el desempeño de GPT-4 en tareas similares a Sally-Anne se puede aumentar al 100% a través de estrategias de indicaciones mejoradas, ^[18] este enfoque parece mejorar la precisión a solo el 73% en el conjunto de datos ToMi más grande. ^[16] En un trabajo relacionado, los investigadores han descubierto que los LLM no exhiben intuiciones similares a las humanas sobre los objetivos que otros agentes persiguen, ^[19] y que no producen de manera confiable inferencias graduadas sobre los objetivos de otros agentes a partir de acciones observadas. ^[20] Por lo tanto, el grado en el que los LLM como GPT-4 pueden realizar razonamiento social sigue siendo un área activa de investigación.

Referencias

^ Wimmer, Heinz; Perner, Josef (enero de 1983). "Creencias sobre creencias: representación y función restrictiva de creencias erróneas en la comprensión del engaño por parte de niños pequeños". Cognición . 13 (1): 103–128. doi :10.1016/0010-0277(83)90004-5. PMID 6681741. S2CID 17014009.
^ Wimmer y Perner (1983) (1983). "Creencias sobre creencias: representación y función restrictiva de creencias erróneas en la comprensión del engaño por parte de niños pequeños. Cognición, 13, 103-128". Cognición . 13 (1): 103–128. doi :10.1016/0010-0277(83)90004-5. PMID 6681741.{{cite journal}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
^ abcd Baron-Cohen, Simon; Leslie, Alan M.; Frith, Uta (octubre de 1985). "¿Tiene el niño autista una "teoría de la mente"?". Cognición . 21 (1): 37–46. doi :10.1016/0010-0277(85)90022-8. PMID 2934210. S2CID 14955234.Pdf.
^ Leslie, Alan M.; Frith, Uta (noviembre de 1988). "Comprensión de los niños autistas de ver, saber y creer". British Journal of Developmental Psychology . 6 (4): 315–324. doi :10.1111/j.2044-835X.1988.tb01104.x.
^ Premack, David; Woodruff, Guy (diciembre de 1978). "¿Tiene el chimpancé una teoría de la mente?". Ciencias del comportamiento y del cerebro . 1 (4): 515–526. doi : 10.1017/S0140525X00076512 .
^ "Autismo y teoría de la mente: una teoría en transición". www.jeramyt.org . Consultado el 9 de octubre de 2016 .
^ Ruffman, Ted; Garnham, Wendy; Rideout, Paul (noviembre de 2001). "Comprensión social en el autismo: la mirada como medida de las percepciones básicas". Revista de Psicología Infantil y Psiquiatría . 42 (8): 1083–1094. doi :10.1111/1469-7610.00807. PMID 11806690.
^ Tager-Flusberg, Helen (diciembre de 2007). "Evaluación de la hipótesis de la teoría de la mente en el autismo". Current Directions in Psychological Science . 16 (6): 311–315. doi :10.1111/j.1467-8721.2007.00527.x. S2CID 16474678.
^ Krupenye, Christopher; Kano, Fumihiro; Hirata, Satoshi; Llama, Josep; Tomasello, Michael (7 de octubre de 2016). "Los grandes simios anticipan que otros individuos actuarán según creencias falsas". Ciencia . 354 (6308): 110–114. Código Bib : 2016 Ciencia... 354.. 110K. doi : 10.1126/ciencia.aaf8110 . hdl : 10161/13632 . ISSN 0036-8075. PMID 27846501.
^ Devlin, Hannah (6 de octubre de 2016). «Un estudio revela que los simios pueden adivinar lo que piensan los demás, al igual que los humanos». The Guardian . ISSN 0261-3077 . Consultado el 9 de octubre de 2016 .
^ Rabinowitz, Neil; Perbet, Frank; Song, Francis; Zhang, Chiyuan; Eslami, SM Ali; Botvinick, Matthew (3 de julio de 2018). "Teoría de la mente basada en máquinas". Actas de la 35.ª Conferencia internacional sobre aprendizaje automático . PMLR: 4218–4227.
^ Shvo, Maayan; Klassen, Toryn Q.; Sohrabi, Shirin; McIlraith, Sheila A. (13 de mayo de 2020). "Reconocimiento del plan epistémico". Actas de la 19.ª Conferencia internacional sobre agentes autónomos y sistemas multiagente . AAMAS '20. Richland, SC: Fundación Internacional para Agentes Autónomos y Sistemas Multiagente: 1251–1259. ISBN 978-1-4503-7518-4.
^ Baker, Chris L.; Jara-Ettinger, Julian; Saxe, Rebecca; Tenenbaum, Joshua B. (13 de marzo de 2017). "Atribución cuantitativa racional de creencias, deseos y percepciones en la mentalización humana". Nature Human Behaviour . 1 (4): 1–10. doi :10.1038/s41562-017-0064. ISSN 2397-3374. S2CID 3338320.
^ Bubeck, Sébastien; Chandrasekaran, Varun; Eldan, Ronen; Gehrke, Johannes; Horvitz, Eric; Kamar, Ece; Lee, Pedro; Lee, Yin Tat; Li, Yuanzhi; Lundberg, Scott; Nori, Harsha; Palangi, Hamid; Ribeiro, Marco Tulio; Zhang, Yi (2023). "Chispas de inteligencia general artificial: primeros experimentos con GPT-4". arXiv : 2303.12712v5 [cs.CL].
^ Sap, Maarten; LeBras, Ronan; Fried, Daniel; Choi, Yejin (2022). "¿Teoría neuronal de la mente? Sobre los límites de la inteligencia social en grandes LM". arXiv : 2210.13312 [cs.CL].
^ ab Shapira, Natalie; Levy, Mosh; Alavi, Seyed Hossein; Zhou, Xuhui; Choi, Yejin; Goldberg, Yoav; Sap, Maarten; Shwartz, Vered (2023). "¿Clever Hans o teoría neuronal de la mente? Pruebas de estrés del razonamiento social en modelos de lenguaje grandes". arXiv : 2305.14763 [cs.CL].
^ Ullman, Tomer (2023). "Los modelos de lenguaje de gran tamaño fallan en alteraciones triviales en tareas de teoría de la mente". arXiv : 2302.08399 [cs.AI].
^ Moghaddam, Shima Rahimi; Honey, Christopher J. (2023). "Mejorar el rendimiento de la teoría de la mente en modelos lingüísticos de gran tamaño mediante estímulos". arXiv : 2304.11490 [cs.AI].
^ Ruis, Laura; Findeis, Arduin; Bradley, Herbie; Rahmani, Hossein A.; Choe, Kyoung Whan; Grefenstette, Edward; Rocktäschel, Tim (29 de junio de 2023). "¿Los LLM codifican selectivamente el objetivo del alcance de un agente?". {{cite journal}}: Requiere citar revista |journal=( ayuda )
^ Ying, Lance; Collins, Katherine M.; Wei, Megan; Zhang, Cedegao E.; Zhi-Xuan, Tan; Weller, Adrian; Tenenbaum, Joshua B.; Wong, Lionel (2023). "El motor de planificación inversa neurosimbólica (NIPE): modelado de inferencias sociales probabilísticas a partir de entradas lingüísticas". arXiv : 2306.14325 [cs.AI].