El análisis causal es el campo del diseño experimental y las estadísticas relacionadas con el establecimiento de causa y efecto. [1] Por lo general, implica establecer cuatro elementos: correlación , secuencia en el tiempo (es decir, las causas deben ocurrir antes de que se produzca el efecto propuesto), un mecanismo físico o teórico de la información plausible para que un efecto observado siga a una posible causa, y eliminar el posibilidad de causas comunes y alternativas ("especiales") . Dicho análisis suele implicar uno o más experimentos artificiales o naturales . [2]
El análisis de datos se ocupa principalmente de cuestiones causales. [3] [4] [5] [6] [7] Por ejemplo, ¿el fertilizante hizo que los cultivos crecieran? [8] ¿O se puede prevenir una determinada enfermedad? [9] O, ¿por qué mi amigo está deprimido? [10] Los resultados potenciales y las técnicas de análisis de regresión manejan dichas consultas cuando los datos se recopilan mediante experimentos diseñados. Los datos recopilados en estudios observacionales requieren diferentes técnicas para la inferencia causal (debido, por ejemplo, a cuestiones como la confusión ). [11] Las técnicas de inferencia causal utilizadas con datos experimentales requieren suposiciones adicionales para producir inferencias razonables con datos de observación. [12] La dificultad de la inferencia causal en tales circunstancias a menudo se resume en que " la correlación no implica causalidad ".
La naturaleza de la causalidad se investiga sistemáticamente en varias disciplinas académicas , incluidas la filosofía y la física .
En el ámbito académico existe un número importante de teorías sobre la causalidad; El Oxford Handbook of Causation (Beebee, Hitchcock & Menzies 2009) abarca 770 páginas. Entre las teorías más influyentes dentro de la filosofía se encuentran las Cuatro causas de Aristóteles y el ocasionalismo de Al-Ghazali . [13] David Hume argumentó que las creencias sobre la causalidad se basan en la experiencia, y la experiencia de manera similar se basa en el supuesto de que el futuro modela el pasado, que a su vez solo puede basarse en la experiencia, lo que conduce a una lógica circular . En conclusión, afirmó que la causalidad no se basa en un razonamiento real : en realidad sólo se puede percibir la correlación. [14] Immanuel Kant , según Beebee, Hitchcock & Menzies (2009), sostuvo que "un principio causal según el cual todo evento tiene una causa, o se sigue según una ley causal, no puede establecerse mediante inducción como una afirmación puramente empírica". , ya que entonces carecería de estricta universalidad o necesidad".
Fuera del campo de la filosofía, las teorías de causalidad se pueden identificar en la mecánica clásica , la mecánica estadística , la mecánica cuántica , las teorías del espacio-tiempo , la biología , las ciencias sociales y el derecho . [13] Para establecer una correlación como causal dentro de la física , normalmente se entiende que la causa y el efecto deben conectarse a través de un mecanismo local (cf. por ejemplo el concepto de impacto ) o un mecanismo no local (cf. el concepto de campo ). , de acuerdo con las leyes conocidas de la naturaleza .
Desde el punto de vista de la termodinámica , las propiedades universales de las causas en comparación con los efectos han sido identificadas a través de la Segunda ley de la termodinámica , confirmando la visión antigua, medieval y cartesiana [15] de que "la causa es mayor que el efecto" para lo particular. Caso de la energía libre termodinámica . Esto, a su vez, es cuestionado [ dudoso – discutir ] por interpretaciones populares de los conceptos de sistemas no lineales y el efecto mariposa , en los que pequeños eventos causan grandes efectos debido, respectivamente, a la imprevisibilidad y a una activación improbable de grandes cantidades de energía potencial .
Intuitivamente, la causalidad parece requerir no sólo una correlación, sino una dependencia contrafactual . Supongamos que un estudiante obtuvo un mal desempeño en un examen y adivina que la causa fue que no estudió. Para probar esto, uno piensa en el contrafactual: el mismo estudiante que hace el mismo examen en las mismas circunstancias pero que estudió la noche anterior. Si se pudiera rebobinar la historia y cambiar sólo una pequeña cosa (hacer que el estudiante estudiara para el examen), entonces se podría observar la causalidad (comparando la versión 1 con la versión 2). Como no es posible rebobinar la historia y reproducir los acontecimientos después de realizar pequeños cambios controlados, la causalidad sólo puede inferirse, nunca conocerse con exactitud. Esto se conoce como el problema fundamental de la inferencia causal: es imposible observar directamente los efectos causales. [16]
Un objetivo importante de los experimentos científicos y los métodos estadísticos es aproximarse lo mejor posible al estado contrafactual del mundo. [17] Por ejemplo, se podría realizar un experimento con gemelos idénticos que obtuvieran consistentemente las mismas calificaciones en sus exámenes. Un gemelo es enviado a estudiar durante seis horas mientras que el otro es enviado al parque de diversiones. Si sus puntajes de repente divergieran en gran medida, esto sería una fuerte evidencia de que estudiar (o ir al parque de diversiones) tuvo un efecto causal en los puntajes de los exámenes. En este caso, la correlación entre el estudio y las puntuaciones de los exámenes implicaría casi con certeza una causalidad.
Los estudios experimentales bien diseñados reemplazan la igualdad de individuos como en el ejemplo anterior por la igualdad de grupos. El objetivo es construir dos grupos que sean similares excepto por el trato que reciben los grupos. Esto se logra seleccionando sujetos de una única población y asignándolos aleatoriamente a dos o más grupos. La probabilidad de que los grupos se comporten de manera similar entre sí (en promedio) aumenta con el número de sujetos en cada grupo. Si los grupos son esencialmente equivalentes excepto por el tratamiento que reciben, y se observa una diferencia en el resultado de los grupos, entonces esto constituye evidencia de que el tratamiento es responsable del resultado o, en otras palabras, el tratamiento causa el efecto observado. Sin embargo, un efecto observado también podría ser causado "por casualidad", por ejemplo como resultado de perturbaciones aleatorias en la población. Existen pruebas estadísticas para cuantificar la probabilidad de concluir erróneamente que existe una diferencia observada cuando en realidad no es así (por ejemplo, consulte el valor P ).
Clive Granger creó la primera definición operativa de causalidad en 1969. [18] Granger hizo operativa la definición de causalidad probabilística propuesta por Norbert Wiener como una comparación de varianzas. [19]
Peter Spirtes, Clark Glymour y Richard Scheines introdujeron la idea de no proporcionar explícitamente una definición de causalidad [ se necesita aclaración ] . [3] Spirtes y Glymour introdujeron el algoritmo PC para el descubrimiento causal en 1990. [20] Muchos algoritmos recientes de descubrimiento causal siguen el enfoque de verificación de Spirtes-Glymour. [21]
El análisis causal exploratorio, también conocido como "causalidad de datos" o "descubrimiento causal" [3], es el uso de algoritmos estadísticos para inferir asociaciones en conjuntos de datos observados que son potencialmente causales bajo suposiciones estrictas. La ECA es un tipo de inferencia causal distinta del modelado causal y los efectos del tratamiento en ensayos controlados aleatorios . [4] Es una investigación exploratoria que generalmente precede a una investigación causal más formal de la misma manera que el análisis de datos exploratorios a menudo precede a las pruebas de hipótesis estadísticas en el análisis de datos . [22] [23]