Análisis de ruta (estadísticas)

En estadística , el análisis de ruta se utiliza para describir las dependencias dirigidas entre un conjunto de variables. Esto incluye modelos equivalentes a cualquier forma de análisis de regresión múltiple , análisis factorial , análisis de correlación canónica , análisis discriminante , así como familias de modelos más generales en el análisis multivariado de varianza y análisis de covarianza ( MANOVA , ANOVA , ANCOVA ).

Además de considerarse una forma de regresión múltiple centrada en la causalidad, el análisis de trayectoria puede verse como un caso especial de modelado de ecuaciones estructurales (SEM) , en el que sólo se emplean indicadores únicos para cada una de las variables del modelo causal. . Es decir, el análisis de trayectoria es SEM con un modelo estructural, pero sin un modelo de medición. Otros términos utilizados para referirse al análisis de trayectoria incluyen modelado causal y análisis de estructuras de covarianza.

Judea Pearl considera que el análisis de caminos es un antepasado directo de las técnicas de inferencia causal . ^[1]

Historia

El análisis de rutas fue desarrollado alrededor de 1918 por el genetista Sewall Wright , quien escribió sobre él más extensamente en la década de 1920. ^[2] Desde entonces se ha aplicado a una amplia gama de áreas de modelado complejo, incluidas la biología , la psicología , la sociología y la econometría . ^[3]

Modelado de rutas

Normalmente, los modelos de trayectoria constan de variables independientes y dependientes representadas gráficamente mediante cuadros o rectángulos. Las variables que son independientes y no dependientes se denominan "exógenas". Gráficamente, estos cuadros de variables exógenas se encuentran en los bordes exteriores del modelo y solo tienen flechas de una sola punta que salen de ellos. Ninguna flecha de una sola punta apunta a variables exógenas. Las variables que son únicamente variables dependientes, o que son a la vez variables independientes y dependientes, se denominan "endógenas". Gráficamente, las variables endógenas tienen al menos una flecha de una sola punta que las apunta.

En el modelo siguiente, las dos variables exógenas (Ex ₁ y Ex ₂ ) se modelan como correlacionadas como lo representa la flecha de dos puntas. Ambas variables tienen efectos directos e indirectos (a través de En ₁ ) sobre En ₂ (las dos variables/factores dependientes o "endógenos"). En la mayoría de los modelos del mundo real, las variables endógenas también pueden verse afectadas por variables y factores que surgen fuera del modelo (efectos externos, incluido el error de medición). Estos efectos se representan mediante la "e" o términos de error en el modelo.

Utilizando las mismas variables, son concebibles modelos alternativos. Por ejemplo, se puede plantear la hipótesis de que Ex ₁ tiene sólo un efecto indirecto sobre En ₂ , eliminando la flecha de Ex ₁ a En ₂ ; y la probabilidad o "ajuste" de estos dos modelos se puede comparar estadísticamente.

Reglas de seguimiento de ruta

Para calcular válidamente la relación entre dos cuadros cualesquiera en el diagrama, Wright (1934) propuso un conjunto simple de reglas de seguimiento de trayectoria, ^[4] para calcular la correlación entre dos variables. La correlación es igual a la suma de la contribución de todas las vías a través de las cuales se conectan las dos variables. La fuerza de cada una de estas vías contribuyentes se calcula como el producto de los coeficientes de trayectoria a lo largo de esa vía.

Las reglas para el seguimiento de rutas son:

Puede rastrear una flecha hacia atrás y luego hacia adelante a lo largo de la siguiente, o hacia adelante de una variable a otra, pero nunca hacia adelante y luego hacia atrás. Otra forma de pensar en esta regla es que nunca se puede pasar de una punta de flecha a otra punta de flecha: cara-cruz, o cruz-cara, no cara-cara.
Puede pasar por cada variable solo una vez en una cadena de rutas determinada.
No se puede incluir más de una flecha bidireccional en cada cadena de ruta.

Nuevamente, la correlación esperada debida a cada cadena trazada entre dos variables es el producto de los coeficientes de ruta estandarizados, y la correlación total esperada entre dos variables es la suma de estas cadenas de ruta contribuyentes.

NB : Las reglas de Wright suponen un modelo sin bucles de retroalimentación: el gráfico dirigido del modelo no debe contener ciclos , es decir, es un gráfico acíclico dirigido , que ha sido ampliamente estudiado en el marco de análisis causal de Judea Pearl .

Seguimiento de ruta en modelos no estandarizados

Si las variables modeladas no han sido estandarizadas, una regla adicional permite calcular las covarianzas esperadas siempre que no existan caminos que conecten las variables dependientes con otras variables dependientes.

El caso más simple se obtiene cuando todas las varianzas residuales se modelan explícitamente. En este caso, además de las tres reglas anteriores, calcule las covarianzas esperadas mediante:

Calcule el producto de los coeficientes en cada ruta entre las variables de interés, rastreando hacia atrás, cambiando de dirección en una flecha de dos puntas y luego rastreando hacia adelante.
Suma de todas las rutas distintas, donde las rutas se consideran distintas si contienen coeficientes diferentes o si encuentran esos coeficientes en un orden diferente.

Cuando las varianzas residuales no se incluyen explícitamente, o como una solución más general, en cualquier cambio de dirección encontrado en una ruta (excepto en las flechas de dos direcciones), incluya la varianza de la variable en el punto de cambio. Es decir, al trazar un camino desde una variable dependiente a una variable independiente, incluya la varianza de la variable independiente excepto cuando hacerlo violaría la regla 1 anterior (pasando por puntas de flecha adyacentes: es decir, cuando la variable independiente también se conecta a una doble flecha con punta que la conecta con otra variable independiente). Al derivar varianzas (lo cual es necesario en el caso de que no se modelen explícitamente), el camino desde una variable dependiente a una variable independiente y viceversa se cuenta una sola vez.

Ver también

Referencias

^ Pearl, Judea (mayo de 2018). El libro del por qué . Nueva York: Libros básicos. pag. 6.ISBN _ 978-0-465-09760-9.
^ Wright, S. (1921). "Correlación y causalidad". J. Investigación Agrícola . 20 : 557–585.
^ Dodge, Y. (2003) Diccionario Oxford de términos estadísticos. OUP. ISBN 0-19-920613-9
^ Wright, S. (1934). "El método de los coeficientes de trayectoria". Anales de estadística matemática . 5 (3): 161–215. doi : 10.1214/aoms/1177732676 .

enlaces externos

Ωnyx, un entorno de software gratuito para el modelado de ecuaciones estructurales
OpenMx - Modelado Avanzado de Ecuaciones Estructurales
LISREL: modelo, métodos y software para el modelado de ecuaciones estructurales