Problema de los caminos que se bifurcan

El jardín de caminos que se bifurcan es un problema en las pruebas de hipótesis frecuentistas a través del cual los investigadores pueden producir involuntariamente falsos positivos para una hipótesis probada, al dejarse demasiados grados de libertad. A diferencia de las expediciones de pesca como la extracción de datos , donde solo se publican los resultados esperados o aparentemente significativos, esto permite un efecto similar incluso cuando se realiza un solo experimento, a través de una serie de opciones sobre cómo implementar métodos y análisis, que a su vez están informados por los datos a medida que se observan y procesan. ^[1]

Historia

En algún momento, la exploración de un árbol de decisiones bifurcado mientras se analizan datos se agrupó con el problema de comparaciones múltiples como un ejemplo de método estadístico deficiente. Sin embargo, Gelman y Loken demostraron ^[2] que esto puede suceder implícitamente por investigadores conscientes de las mejores prácticas que solo realizan una única comparación y evalúan sus datos solo una vez.

La falacia consiste en creer que un análisis está libre de comparaciones múltiples a pesar de haber tenido suficientes grados de libertad para elegir el método, después de ver algunos o todos los datos, como para producir falsos positivos con fundamentos similares. Los grados de libertad pueden incluir la elección entre efectos principales o interacciones, métodos de exclusión de datos, si se combinan diferentes estudios y el método de análisis de datos.

Análisis del multiverso

Un análisis multiverso es un enfoque que reconoce la multitud de caminos analíticos disponibles al analizar datos. El concepto está inspirado en el metafórico "jardín de caminos que se bifurcan", que representa la multitud de análisis potenciales que podrían realizarse en un solo conjunto de datos. En un análisis multiverso, los investigadores varían sistemáticamente sus opciones analíticas para explorar una gama de posibles resultados a partir de los mismos datos sin procesar. ^[3]^[4]^[5] Esto implica alterar variables como los criterios de inclusión/exclusión de datos, las transformaciones de variables, el manejo de valores atípicos, los modelos estadísticos y las pruebas de hipótesis para generar un espectro de resultados que podrían haberse obtenido dadas diferentes decisiones analíticas.

Los beneficios clave de un análisis multiverso incluyen:

Transparencia. Hace que el proceso analítico sea más transparente al discutir abiertamente el impacto de las diferentes opciones analíticas en los resultados.
Robustez. Al examinar cómo varían las conclusiones en una variedad de escenarios analíticos, los investigadores pueden evaluar la solidez de sus hallazgos. Si una conclusión se mantiene en muchos análisis plausibles, se considera más sólida y es menos probable que sea el resultado de una toma de decisiones arbitraria.
Identificación de decisiones importantes. Ayuda a identificar qué decisiones analíticas influyen más fuertemente en los resultados, orientando a los investigadores hacia opciones metodológicas más informadas en estudios futuros.

Este enfoque es valioso en campos donde los hallazgos de investigación son sensibles a los métodos de análisis de datos, como la psicología, ^[4] la neurociencia, ^[5] la economía y las ciencias sociales. El análisis multiverso tiene como objetivo mitigar los problemas relacionados con la reproducibilidad y replicabilidad al revelar cómo diferentes opciones analíticas pueden llevar a diferentes conclusiones a partir del mismo conjunto de datos. Por lo tanto, fomenta una comprensión más matizada del análisis de datos, promoviendo la integridad y la credibilidad en la investigación científica.

Los conceptos que están estrechamente relacionados con el análisis del multiverso son el análisis de la curva de especificación ^[6] y la evaluación de la vibración de los efectos. ^[7]

Véase también

Referencias

^ "Jardín de senderos que se bifurcan". FORRT - Marco para la formación en investigación abierta y reproducible . Consultado el 28 de julio de 2023 .
^ Gelman, Andrew; Loken, Eric (14 de noviembre de 2013). "El jardín de los caminos que se bifurcan: por qué las comparaciones múltiples pueden ser un problema, incluso cuando no hay una "expedición de pesca" o un "p-hacking" y la hipótesis de investigación se planteó con antelación" (PDF) .
^ Steegen, Sara; Tuerlinckx, Francis; Gelman, Andrew; Vanpaemel, Wolf (2016). "Aumento de la transparencia mediante un análisis multiverso". Perspectivas sobre la ciencia psicológica . 11 (5): 702–712. doi :10.1177/1745691616658637. ISSN 1745-6916.
^ ab Harder, Jenna A. (2020). "El multiverso de métodos: extensión del análisis multiverso para abordar las decisiones de recopilación de datos". Perspectivas sobre la ciencia psicológica . 15 (5): 1158–1177. doi :10.1177/1745691620917678. ISSN 1745-6916.
^ ab Clayson, Peter E. (1 de marzo de 2024). "Más allá de paradigmas, canales y resultados individuales: adopción de análisis multiverso en psicofisiología". Revista internacional de psicofisiología . 197 : 112311. doi : 10.1016/j.ijpsycho.2024.112311 . ISSN 0167-8760.
^ Simonsohn, Uri; Simmons, Joseph P.; Nelson, Leif D. (2020). "Análisis de la curva de especificación". Nature Human Behaviour . 4 (11): 1208–1214. doi :10.1038/s41562-020-0912-z. ISSN 2397-3374.
^ Patel, Chirag J.; Burford, Belinda; Ioannidis, John PA (2015). "La evaluación de la vibración de los efectos debido a la especificación del modelo puede demostrar la inestabilidad de las asociaciones observacionales". Revista de epidemiología clínica . 68 (9): 1046–1058. doi :10.1016/j.jclinepi.2015.05.029. ISSN 0895-4356. PMC 4555355 . PMID 26279400.