stringtranslate.com

Análisis multivariante de varianza

La imagen de arriba muestra una comparación visual entre el análisis de varianza multivariado (MANOVA) y el análisis de varianza univariado (ANOVA). En el análisis de varianza multivariado (MANOVA), los investigadores examinan las diferencias de grupo de una variable independiente singular en múltiples variables de resultado, mientras que en el análisis de varianza univariado, los investigadores examinan las diferencias de grupo de, a veces, múltiples variables independientes en una variable de resultado singular. En el ejemplo proporcionado, los niveles de la variable de varianza pueden incluir la escuela secundaria, la universidad y la escuela de posgrado. Los resultados de un análisis de varianza multivariado (MANOVA) pueden indicarnos si una persona que completó la escuela de posgrado mostró una mayor satisfacción con la vida y el trabajo que una persona que completó solo la escuela secundaria o la universidad. Los resultados de un análisis de varianza univariado solo pueden indicarnos esta información en el caso de la satisfacción con la vida. El análisis de las diferencias de grupo en múltiples variables de resultado a menudo proporciona información más precisa, ya que una relación pura solo entre X y solo Y rara vez existe en la naturaleza.

En estadística , el análisis de varianza multivariable ( MANOVA ) es un procedimiento para comparar medias de muestras multivariables . Como procedimiento multivariable, se utiliza cuando hay dos o más variables dependientes , [1] y suele ir seguido de pruebas de significación que involucran variables dependientes individuales por separado. [2]

Sin relación con la imagen, las variables dependientes pueden ser k puntuaciones de satisfacción con la vida medidas en puntos temporales secuenciales y p puntuaciones de satisfacción laboral medidas en puntos temporales secuenciales. En este caso hay k+p variables dependientes cuya combinación lineal sigue una distribución normal multivariada, homogeneidad de matriz de varianza-covarianza multivariada y relación lineal, sin multicolinealidad y sin valores atípicos.

Modelo

Supongamos observaciones de dimensión 1, donde la observación n se asigna al grupo y se distribuye alrededor del centro del grupo con ruido gaussiano multivariado : donde es la matriz de covarianza . Luego formulamos nuestra hipótesis nula como

Relación con ANOVA

MANOVA es una forma generalizada de análisis de varianza univariado (ANOVA), [1] aunque, a diferencia del ANOVA univariado , utiliza la covarianza entre las variables de resultado para probar la significancia estadística de las diferencias de medias.

Donde en el análisis de varianza univariado aparecen sumas de cuadrados , en el análisis de varianza multivariado aparecen ciertas matrices definidas positivas . Las entradas diagonales son los mismos tipos de sumas de cuadrados que aparecen en el ANOVA univariado. Las entradas fuera de la diagonal son sumas de productos correspondientes. Bajo supuestos de normalidad sobre distribuciones de error , la contraparte de la suma de cuadrados debido al error tiene una distribución de Wishart .


Prueba de hipótesis

En primer lugar, defina las siguientes matrices:

Entonces la matriz es una generalización de la suma de cuadrados explicada por el grupo, y es una generalización de la suma de cuadrados residual . [3] [4] Nótese que alternativamente también se podría hablar de covarianzas cuando las matrices mencionadas anteriormente se escalan por 1/(n-1) ya que las estadísticas de prueba posteriores no cambian al multiplicar y por la misma constante distinta de cero.

Las estadísticas más comunes [3] [5] son ​​resúmenes basados ​​en las raíces (o valores propios) de la matriz.

La discusión continúa sobre los méritos de cada una de ellas, [1] aunque la raíz más grande sólo conduce a un límite de significación que no suele tener interés práctico. Una complicación adicional es que, a excepción de la raíz más grande de Roy, la distribución de estas estadísticas bajo la hipótesis nula no es sencilla y sólo se puede aproximar excepto en unos pocos casos de baja dimensión. En [7] se derivó un algoritmo para la distribución de la raíz más grande de Roy bajo la hipótesis nula , mientras que en [8] se estudia la distribución bajo la alternativa.

La aproximación más conocida para lambda de Wilks fue derivada por CR Rao .

En el caso de dos grupos, todas las estadísticas son equivalentes y la prueba se reduce al cuadrado T de Hotelling .

Introducción de covariables (MANCOVA)

También se puede comprobar si hay un efecto de grupo después de ajustar las covariables. Para ello, siga el procedimiento anterior pero sustituya con las predicciones del modelo lineal general , que contiene el grupo y las covariables, y sustituya con las predicciones del modelo lineal general que contiene solo las covariables (y una intersección). Luego, la suma adicional de cuadrados se explica agregando la información de agrupamiento y es la suma residual de cuadrados del modelo que contiene el agrupamiento y las covariables. [4]

Tenga en cuenta que en el caso de datos no balanceados, el orden de adición de las covariables importa.

Correlación de variables dependientes

Esta es una representación gráfica de la relación requerida entre las variables de resultado en un análisis de varianza multivariante. Parte del análisis implica la creación de una variable compuesta, contra la cual se analizan las diferencias de grupo de la variable independiente. Las variables compuestas, como puede haber múltiples, son diferentes combinaciones de las variables de resultado. Luego, el análisis determina qué combinación muestra las mayores diferencias de grupo para la variable independiente. Luego, se utiliza un análisis discriminante descriptivo como prueba post hoc para determinar cuál es la composición de esa variable compuesta que crea las mayores diferencias de grupo.
Esta es una representación visual simple del efecto de dos variables dependientes altamente correlacionadas dentro de un MANOVA. Si dos (o más) variables dependientes están altamente correlacionadas, las probabilidades de que ocurra un error de tipo I se reducen, pero la contrapartida es que la potencia de la prueba MANOVA también se reduce.

La potencia del MANOVA se ve afectada por las correlaciones de las variables dependientes y por los tamaños del efecto asociados con esas variables. Por ejemplo, cuando hay dos grupos y dos variables dependientes, la potencia del MANOVA es mínima cuando la correlación es igual a la relación entre el tamaño del efecto estandarizado más pequeño y el más grande. [9]

Véase también

Referencias

  1. ^ abc Warne, RT (2014). "Una introducción al análisis multivariado de varianza (MANOVA) para científicos del comportamiento". Evaluación práctica, investigación y evaluación . 19 (17): 1–10.
  2. ^ Stevens, JP (2002). Estadística multivariante aplicada a las ciencias sociales. Mahwah, NJ: Lawrence Erblaum.
  3. ^ ab Anderson, TW (1994). Introducción al análisis estadístico multivariante . Wiley.
  4. ^ ab Krzanowski, WJ (1988). Principios del análisis multivariante. La perspectiva de un usuario . Oxford University Press.
  5. ^ UCLA: Servicios de tecnología académica, Grupo de consultoría estadística. «Stata Annotated Output – MANOVA» (Resultado anotado de Stata: MANOVA) . Consultado el 10 de febrero de 2024 .
  6. ^ "Conceptos básicos de MANOVA: estadísticas reales con Excel". www.real-statistics.com . Consultado el 5 de abril de 2018 .
  7. ^ Chiani, M. (2016), "Distribución de la raíz más grande de una matriz para la prueba de Roy en el análisis multivariado de varianza", Journal of Multivariate Analysis , 143 : 467–471, arXiv : 1401.3987v3 , doi : 10.1016/j.jmva.2015.10.007, S2CID  37620291
  8. ^ IM Johnstone, B. Nadler "La prueba de raíz más grande de Roy bajo alternativas de rango uno" preimpresión de arXiv arXiv:1310.6581 (2013)
  9. ^ Frane, Andrew (2015). "Control de potencia y error tipo I para comparaciones univariadas en diseños multivariados de dos grupos". Investigación conductual multivariada . 50 (2): 233–247. doi :10.1080/00273171.2014.968836. PMID  26609880. S2CID  1532673.

Enlaces externos