stringtranslate.com

gráfico causal

En estadística, econometría, epidemiología, genética y disciplinas relacionadas, los gráficos causales (también conocidos como diagramas de ruta , redes bayesianas causales o DAG ) son modelos gráficos probabilísticos que se utilizan para codificar suposiciones sobre el proceso de generación de datos.

Los gráficos causales se pueden utilizar para la comunicación y la inferencia. Son complementarios de otras formas de razonamiento causal, por ejemplo, el uso de notación de igualdad causal. Como dispositivos de comunicación, los gráficos proporcionan una representación formal y transparente de los supuestos causales que los investigadores deseen transmitir y defender. Como herramientas de inferencia, los gráficos permiten a los investigadores estimar los tamaños del efecto a partir de datos no experimentales, [1] [2] [3] [4] [5] derivar implicaciones comprobables de los supuestos codificados, [1] [6] [7] [8] probar la validez externa, [9] y gestionar los datos faltantes [10] y el sesgo de selección. [11]

Los gráficos causales fueron utilizados por primera vez por el genetista Sewall Wright [12] bajo la rúbrica "diagramas de ruta". Posteriormente fueron adoptados por los científicos sociales [13] [14] [15] [16] [17] [18] y, en menor medida, por los economistas. [19] Estos modelos se limitaron inicialmente a ecuaciones lineales con parámetros fijos. Los desarrollos modernos han extendido los modelos gráficos al análisis no paramétrico y, por lo tanto, lograron una generalidad y flexibilidad que ha transformado el análisis causal en la informática, la epidemiología [20] y las ciencias sociales. [21]

Construcción y terminología

El gráfico causal se puede dibujar de la siguiente manera. Cada variable en el modelo tiene un vértice o nodo correspondiente y se dibuja una flecha desde una variable X a una variable Y siempre que se considere que Y responde a cambios en X cuando todas las demás variables se mantienen constantes. Las variables conectadas a Y mediante flechas directas se denominan padres de Y , o "causas directas de Y ", y se denotan por Pa(Y) .

Los modelos causales suelen incluir "términos de error" o "factores omitidos" que representan todos los factores no medidos que influyen en una variable Y cuando Pa(Y) se mantiene constante. En la mayoría de los casos, los términos de error se excluyen del gráfico. Sin embargo, si el autor del gráfico sospecha que los términos de error de dos variables cualesquiera son dependientes (por ejemplo, las dos variables tienen una causa común latente o no observada), entonces se traza un arco bidireccional entre ellas. Así, la presencia de variables latentes se tiene en cuenta a través de las correlaciones que inducen entre los términos de error, representados por arcos bidireccionales.

Herramientas fundamentales

Una herramienta fundamental en el análisis gráfico es la separación d , que permite a los investigadores determinar, mediante inspección, si la estructura causal implica que dos conjuntos de variables son independientes dado un tercer conjunto. En los modelos recursivos sin términos de error correlacionados (a veces llamados Markovianos ), estas independencias condicionales representan todas las implicaciones comprobables del modelo. [22]

Ejemplo

Supongamos que deseamos estimar el efecto de asistir a una universidad de élite sobre los ingresos futuros. La simple regresión de los ingresos sobre la calificación universitaria no dará una estimación imparcial del efecto objetivo porque las universidades de élite son muy selectivas y los estudiantes que asisten a ellas probablemente estén calificados para trabajos bien remunerados antes de asistir a la escuela. Suponiendo que las relaciones causales son lineales, este conocimiento previo se puede expresar en la siguiente especificación del modelo de ecuaciones estructurales (SEM).

Modelo 1

donde representa las calificaciones del individuo antes de la universidad, representa las calificaciones después de la universidad, contiene atributos que representan la calidad de la universidad a la que asistió y el salario del individuo.

Figura 1: Modelo no identificado con variables latentes ( y ) mostradas explícitamente
Figura 2: Modelo no identificado con variables latentes resumidas

La Figura 1 es un gráfico causal que representa la especificación de este modelo. Cada variable del modelo tiene un nodo o vértice correspondiente en el gráfico. Además, para cada ecuación, se dibujan flechas desde las variables independientes hasta las variables dependientes. Estas flechas reflejan la dirección de la causalidad. En algunos casos, podemos etiquetar la flecha con su correspondiente coeficiente estructural como en la Figura 1.

Si y son variables no observadas o latentes, su influencia sobre y puede atribuirse a sus términos de error. Al eliminarlos obtenemos la siguiente especificación del modelo:

Modelo 2

La información básica especificada por el Modelo 1 implica que el término de error de , está correlacionado con el término de error de C. Como resultado, agregamos un arco bidireccional entre S y C , como en la Figura 2.

Figura 3: Modelo identificado con variables latentes ( y ) mostradas explícitamente
Figura 4: Modelo identificado con variables latentes resumidas

Puesto que está correlacionado con y, por lo tanto , es endógeno y no se identifica en el Modelo 2. Sin embargo, si incluimos la solidez de la solicitud universitaria de un individuo, como se muestra en la Figura 3, obtenemos el siguiente modelo:

Modelo 3

Eliminando las variables latentes de la especificación del modelo obtenemos:

Modelo 4

con correlacionado con .

Ahora, se identifica y se puede estimar mediante la regresión de on y . Esto se puede verificar utilizando el criterio de puerta única , [1] [23] una condición gráfica necesaria y suficiente para la identificación de coeficientes estructurales, como , mediante regresión.

Referencias

  1. ^ abc Perla, Judea (2000). Causalidad . Cambridge, MA: MIT Press. ISBN 9780521773621.
  2. ^ Tian, ​​Jin; Perla, Judea (2002). "Una condición general de identificación de efectos causales". Actas del Decimoctavo Congreso Nacional sobre Inteligencia Artificial . ISBN 978-0-262-51129-2.
  3. ^ Shpitser, Ilya; Perla, Judea (2008). "Métodos completos de identificación de la jerarquía causal" (PDF) . Revista de investigación sobre aprendizaje automático . 9 : 1941-1979.
  4. ^ Huang, Y.; Valtorta, M. (2006). https://www.aaai.org/Papers/AAAI/2006/AAAI06-180.pdf. {{cite journal}}: Citar diario requiere |journal=( ayuda ) ; Falta o está vacío |title=( ayuda )
  5. ^ Bareinboim, Elías; Perla, Judea (2012). "Inferencia causal mediante experimentos sustitutos: identificabilidad z". Actas de la Vigésima Octava Conferencia sobre la Incertidumbre en la Inteligencia Artificial . arXiv : 1210.4842 . Código Bib : 2012arXiv1210.4842B. ISBN 978-0-9749039-8-9.
  6. ^ Tian, ​​Jin; Perla, Judea (2002). "Sobre las implicaciones comprobables de modelos causales con variables ocultas". Actas de la Decimoctava Conferencia sobre Incertidumbre en Inteligencia Artificial . págs. 519–27. arXiv : 1301.0608 . Código Bib : 2013arXiv1301.0608T. ISBN 978-1-55860-897-9.
  7. ^ Shpitser, Ilya; Perla, Judea (2008). {{cite journal}}: Citar diario requiere |journal=( ayuda ) ; Falta o está vacío |title=( ayuda )
  8. ^ Chen, Bryant; Perla, Judea (2014). "Implicaciones comprobables de modelos de ecuaciones estructurales lineales". Actas de la Conferencia AAAI sobre Inteligencia Artificial . 28 . doi : 10.1609/aaai.v28i1.9065 . S2CID  1612893.
  9. ^ Bareinmboim, Elías; Perla, Judea (2014). "Validez externa: del cálculo a la transportabilidad entre poblaciones". Ciencia estadística . 29 (4): 579–595. arXiv : 1503.01603 . doi :10.1214/14-sts486. S2CID  5586184.
  10. ^ Mohan, Karthika; Perla, Judea; Tian, ​​Jin (2013). "Modelos gráficos para inferencia con datos faltantes" (PDF) . Avances en los sistemas de procesamiento de información neuronal .
  11. ^ Bareinboim, Elías; Tian, ​​Jin; Perla, Judea (2014). "Recuperarse del sesgo de selección en la inferencia causal y estadística". Actas de la Conferencia AAAI sobre Inteligencia Artificial . 28 . doi : 10.1609/aaai.v28i1.9074 .
  12. ^ Wright, S. (1921). "Correlación y causalidad". Revista de Investigación Agrícola . 20 : 557–585.
  13. ^ Blalock, HM (1960). "Análisis correlacional e inferencias causales". Antropólogo estadounidense . 62 (4): 624–631. doi : 10.1525/aa.1960.62.4.02a00060 .
  14. ^ Duncan, sobredosis (1966). "Análisis de caminos: ejemplos sociológicos". Revista Estadounidense de Sociología . 72 : 1–16. doi :10.1086/224256. S2CID  59428866.
  15. ^ Duncan, OD (1976). "Introducción a los modelos de ecuaciones estructurales". Revista Estadounidense de Sociología . 82 (3): 731–733. doi :10.1086/226377.
  16. ^ Jöreskog, KG (1969). "Un enfoque general para el análisis factorial confirmatorio de máxima verosimilitud". Psicometrika . 34 (2): 183–202. doi :10.1007/bf02289343. S2CID  186236320.
  17. ^ Goldberger, COMO; Duncan, OD (1973). Modelos de ecuaciones estructurales en las ciencias sociales . Nueva York: Seminar Press.
  18. ^ Goldberger, AS (1972). "Modelos de ecuaciones estructurales en las ciencias sociales". Econométrica . 40 (6): 979–1001. doi :10.2307/1913851. JSTOR  1913851.
  19. ^ Blanco, Halbert; Chalak, Karim; Lu, Xun (2011). "Vincular la causalidad de Granger y el modelo causal de la perla con sistemas configurables" (PDF) . Causalidad en series temporales Desafíos en el aprendizaje automático . 5 .
  20. ^ Rothman, Kenneth J.; Groenlandia, Sander; Lash, Timoteo (2008). Epidemiología moderna . Lippincott Williams y Wilkins.
  21. ^ Morgan, SL; Winship, C. (2007). Contrafácticos e inferencia causal: métodos y principios para la investigación social . Nueva York: Cambridge University Press.
  22. ^ Geiger, Dan; Perla, Judea (1993). "Propiedades lógicas y algorítmicas de la independencia condicional". Anales de Estadística . 21 (4): 2001-2021. CiteSeerX 10.1.1.295.2043 . doi : 10.1214/aos/1176349407. 
  23. ^ Chen, B.; Perla, J (2014). "Herramientas gráficas para el modelado de ecuaciones estructurales lineales" (PDF) . Reporte técnico .