Análisis causal

El análisis causal es el campo del diseño experimental y las estadísticas relacionadas con el establecimiento de causa y efecto. ^[1] Por lo general, implica establecer cuatro elementos: correlación , secuencia en el tiempo (es decir, las causas deben ocurrir antes de que se produzca el efecto propuesto), un mecanismo físico o teórico de la información plausible para que un efecto observado siga a una posible causa, y eliminar el posibilidad de causas comunes y alternativas ("especiales") . Dicho análisis suele implicar uno o más experimentos artificiales o naturales . ^[2]

Motivación

El análisis de datos se ocupa principalmente de cuestiones causales. ^[3]^[4]^[5]^[6]^[7] Por ejemplo, ¿el fertilizante hizo que los cultivos crecieran? ^[8] ¿O se puede prevenir una determinada enfermedad? ^[9] O, ¿por qué mi amigo está deprimido? ^[10] Los resultados potenciales y las técnicas de análisis de regresión manejan dichas consultas cuando los datos se recopilan mediante experimentos diseñados. Los datos recopilados en estudios observacionales requieren diferentes técnicas para la inferencia causal (debido, por ejemplo, a cuestiones como la confusión ). ^[11] Las técnicas de inferencia causal utilizadas con datos experimentales requieren suposiciones adicionales para producir inferencias razonables con datos de observación. ^[12] La dificultad de la inferencia causal en tales circunstancias a menudo se resume en que " la correlación no implica causalidad ".

En filosofía y física

La naturaleza de la causalidad se investiga sistemáticamente en varias disciplinas académicas , incluidas la filosofía y la física .

En el ámbito académico existe un número importante de teorías sobre la causalidad; El Oxford Handbook of Causation (Beebee, Hitchcock & Menzies 2009) abarca 770 páginas. Entre las teorías más influyentes dentro de la filosofía se encuentran las Cuatro causas de Aristóteles y el ocasionalismo de Al-Ghazali . ^[13]David Hume argumentó que las creencias sobre la causalidad se basan en la experiencia, y la experiencia de manera similar se basa en el supuesto de que el futuro modela el pasado, que a su vez solo puede basarse en la experiencia, lo que conduce a una lógica circular . En conclusión, afirmó que la causalidad no se basa en un razonamiento real : en realidad sólo se puede percibir la correlación. ^[14]Immanuel Kant , según Beebee, Hitchcock & Menzies (2009), sostuvo que "un principio causal según el cual todo evento tiene una causa, o se sigue según una ley causal, no puede establecerse mediante inducción como una afirmación puramente empírica". , ya que entonces carecería de estricta universalidad o necesidad".

Fuera del campo de la filosofía, las teorías de causalidad se pueden identificar en la mecánica clásica , la mecánica estadística , la mecánica cuántica , las teorías del espacio-tiempo , la biología , las ciencias sociales y el derecho . ^[13] Para establecer una correlación como causal dentro de la física , normalmente se entiende que la causa y el efecto deben conectarse a través de un mecanismo local (cf. por ejemplo el concepto de impacto ) o un mecanismo no local (cf. el concepto de campo ). , de acuerdo con las leyes conocidas de la naturaleza .

Desde el punto de vista de la termodinámica , las propiedades universales de las causas en comparación con los efectos han sido identificadas a través de la Segunda ley de la termodinámica , confirmando la visión antigua, medieval y cartesiana ^[15] de que "la causa es mayor que el efecto" para lo particular. Caso de la energía libre termodinámica . Esto, a su vez, es cuestionado ^{[ dudoso – discutir ]} por interpretaciones populares de los conceptos de sistemas no lineales y el efecto mariposa , en los que pequeños eventos causan grandes efectos debido, respectivamente, a la imprevisibilidad y a una activación improbable de grandes cantidades de energía potencial .

Causalidad construida a partir de estados contrafácticos

Intuitivamente, la causalidad parece requerir no sólo una correlación, sino una dependencia contrafactual . Supongamos que un estudiante obtuvo un mal desempeño en un examen y adivina que la causa fue que no estudió. Para probar esto, uno piensa en el contrafactual: el mismo estudiante que hace el mismo examen en las mismas circunstancias pero que estudió la noche anterior. Si se pudiera rebobinar la historia y cambiar sólo una pequeña cosa (hacer que el estudiante estudiara para el examen), entonces se podría observar la causalidad (comparando la versión 1 con la versión 2). Como no es posible rebobinar la historia y reproducir los acontecimientos después de realizar pequeños cambios controlados, la causalidad sólo puede inferirse, nunca conocerse con exactitud. Esto se conoce como el problema fundamental de la inferencia causal: es imposible observar directamente los efectos causales. ^[16]

Un objetivo importante de los experimentos científicos y los métodos estadísticos es aproximarse lo mejor posible al estado contrafactual del mundo. ^[17] Por ejemplo, se podría realizar un experimento con gemelos idénticos que obtuvieran consistentemente las mismas calificaciones en sus exámenes. Un gemelo es enviado a estudiar durante seis horas mientras que el otro es enviado al parque de diversiones. Si sus puntajes de repente divergieran en gran medida, esto sería una fuerte evidencia de que estudiar (o ir al parque de diversiones) tuvo un efecto causal en los puntajes de los exámenes. En este caso, la correlación entre el estudio y las puntuaciones de los exámenes implicaría casi con certeza una causalidad.

Los estudios experimentales bien diseñados reemplazan la igualdad de individuos como en el ejemplo anterior por la igualdad de grupos. El objetivo es construir dos grupos que sean similares excepto por el trato que reciben los grupos. Esto se logra seleccionando sujetos de una única población y asignándolos aleatoriamente a dos o más grupos. La probabilidad de que los grupos se comporten de manera similar entre sí (en promedio) aumenta con el número de sujetos en cada grupo. Si los grupos son esencialmente equivalentes excepto por el tratamiento que reciben, y se observa una diferencia en el resultado de los grupos, entonces esto constituye evidencia de que el tratamiento es responsable del resultado o, en otras palabras, el tratamiento causa el efecto observado. Sin embargo, un efecto observado también podría ser causado "por casualidad", por ejemplo como resultado de perturbaciones aleatorias en la población. Existen pruebas estadísticas para cuantificar la probabilidad de concluir erróneamente que existe una diferencia observada cuando en realidad no es así (por ejemplo, consulte el valor P ).

Definiciones operativas de causalidad

Clive Granger creó la primera definición operativa de causalidad en 1969. ^[18] Granger hizo operativa la definición de causalidad probabilística propuesta por Norbert Wiener como una comparación de varianzas. ^[19]

Verificación por "verdad"

Peter Spirtes, Clark Glymour y Richard Scheines introdujeron la idea de no proporcionar explícitamente una definición de causalidad ^{[ se necesita aclaración ]} . ^[3] Spirtes y Glymour introdujeron el algoritmo PC para el descubrimiento causal en 1990. ^[20] Muchos algoritmos recientes de descubrimiento causal siguen el enfoque de verificación de Spirtes-Glymour. ^[21]

Exploratorio

El análisis causal exploratorio, también conocido como "causalidad de datos" o "descubrimiento causal" ^{[3], es el uso de}algoritmos estadísticos para inferir asociaciones en conjuntos de datos observados que son potencialmente causales bajo suposiciones estrictas. La ECA es un tipo de inferencia causal distinta del modelado causal y los efectos del tratamiento en ensayos controlados aleatorios . ^[4] Es una investigación exploratoria que generalmente precede a una investigación causal más formal de la misma manera que el análisis de datos exploratorios a menudo precede a las pruebas de hipótesis estadísticas en el análisis de datos . ^[22]^[23]

Ver también

Enlaces externos

Herramientas y datos del equipo de Causality Workbench
Herramientas del equipo CCD de la Universidad de Pittsburgh

Referencias

^ Rohlfing, Ingo; Schneider, Carsten Q. (2018). "Un marco unificador para el análisis causal en la investigación multimétodo de teoría de conjuntos" (PDF) . Investigación y métodos sociológicos . 47 (1): 37–63. doi :10.1177/0049124115626170. S2CID 124804330 . Consultado el 29 de febrero de 2020 .
^ Brady, Henry E. (7 de julio de 2011). "Causalidad y explicación en las ciencias sociales". El manual de ciencias políticas de Oxford . doi : 10.1093/oxfordhb/9780199604456.013.0049 . Consultado el 29 de febrero de 2020 .
^ abc Espíritus, P.; Glymour, C.; Scheines, R. (2012). Causalidad, Predicción y Búsqueda . Medios de ciencia y negocios de Springer. ISBN 978-1461227489.
^ ab Rosenbaum, Paul (2017). Observación y experimento: una introducción a la inferencia causal . Prensa de la Universidad de Harvard. ISBN 9780674975576.
^ Perla, Judea; Mackenzie, Dana (2018). El libro del por qué : la nueva ciencia de causa y efecto . Libros básicos. ISBN 978-0465097616.
^ Kleinberg, Samantha (2015). Por qué: una guía para encontrar y utilizar las causas . O'Reilly Media, Inc. ISBN 978-1491952191.
^ Illari, P.; Ruso, F. (2014). Causalidad: la teoría filosófica se encuentra con la práctica científica . OUP Oxford. ISBN 978-0191639685.
^ Pescador, R. (1937). El diseño de experimentos . Oliver y Boyd.
^ Colina, B. (1955). Principios de estadística médica . Lanceta limitada.
^ Halpern, J. (2016). Causalidad real . Prensa del MIT. ISBN 978-0262035026.
^ Perla, J.; Glymour, M.; Jewell, NP (2016). Inferencia causal en estadística: una introducción . John Wiley e hijos. ISBN 978-1119186847.
^ Piedra, R. (1993). "Los supuestos sobre los que descansan las inferencias causales". Revista de la Real Sociedad de Estadística. Serie B (Metodológica) . 55 (2): 455–466. doi :10.1111/j.2517-6161.1993.tb01915.x.
^ ab Beebee, Hitchcock y Menzies 2009
^ Morris, William Edward (2001). "David Hume". La Enciclopedia de Filosofía de Stanford .
^ Lloyd, AC (1976). "El principio de que la causa es mayor que su efecto". Fronesis . 21 (2): 146-156. doi :10.1163/156852876x00101. JSTOR 4181986.
^ Holanda, Paul W. (1986). "Estadística e inferencia causal". Revista de la Asociación Estadounidense de Estadística . 81 (396): 945–960. doi :10.1080/01621459.1986.10478354. S2CID 14377504.
^ Perla, Judea (2000). Causalidad: modelos, razonamiento e inferencia . Prensa de la Universidad de Cambridge. ISBN 9780521773621.
^ Granger, CWJ (1969). "Investigación de relaciones causales mediante modelos econométricos y métodos transespectrales". Econométrica . 37 (3): 424–438. doi :10.2307/1912791. JSTOR 1912791.
^ Granger, Clive. "Conferencia del Premio. NobelPrize.org. Nobel Media AB 2018".
^ Espíritus, P.; Glymour, C. (1991). "Un algoritmo para la recuperación rápida de gráficos causales dispersos". Revisión de informática de ciencias sociales . 9 (1): 62–72. doi :10.1177/089443939100900106. S2CID 38398322.
^ Guo, Ruocheng; Cheng, Lu; Li, Jundong; Hahn, P. Richard; Liu, Huan (2020). "Una encuesta sobre la causalidad del aprendizaje con datos". Encuestas de Computación ACM . 53 (4): 1–37. arXiv : 1809.09337 . doi :10.1145/3397269. S2CID 52822969.
^ McCracken, James (2016). Análisis causal exploratorio con datos de series temporales (Conferencias de síntesis sobre minería de datos y descubrimiento de conocimientos) . Editores Morgan y Claypool. ISBN 978-1627059343.
^ Tukey, John W. (1977). Análisis de datos exploratorios . Pearson. ISBN 978-0201076165.

Bibliografía

Beebee, Helen; Hitchcock, Christopher; Menzies, Peter (2009). El manual de causalidad de Oxford. Prensa de la Universidad de Oxford. ISBN 978-0-19-162946-4.