Procedimiento para comparar medias de muestras multivariadas
En estadística , el análisis de varianza multivariable ( MANOVA ) es un procedimiento para comparar medias de muestras multivariables . Como procedimiento multivariable, se utiliza cuando hay dos o más variables dependientes , [1] y suele ir seguido de pruebas de significación que involucran variables dependientes individuales por separado. [2]
Sin relación con la imagen, las variables dependientes pueden ser k puntuaciones de satisfacción con la vida medidas en puntos temporales secuenciales y p puntuaciones de satisfacción laboral medidas en puntos temporales secuenciales. En este caso hay k+p variables dependientes cuya combinación lineal sigue una distribución normal multivariada, homogeneidad de matriz de varianza-covarianza multivariada y relación lineal, sin multicolinealidad y sin valores atípicos.
Modelo
Supongamos observaciones de dimensión 1, donde la observación n se asigna al grupo y se distribuye alrededor del centro del grupo con ruido gaussiano multivariado : donde es la matriz de covarianza . Luego formulamos nuestra hipótesis nula como
Relación con ANOVA
MANOVA es una forma generalizada de análisis de varianza univariado (ANOVA), [1] aunque, a diferencia del ANOVA univariado , utiliza la covarianza entre las variables de resultado para probar la significancia estadística de las diferencias de medias.
: donde la fila -ésima es la mejor predicción dada la pertenencia al grupo . Es decir, la media de todas las observaciones del grupo : .
: donde la fila -ésima es la mejor predicción sin información. Es decir, la media empírica de todas las observaciones.
Entonces la matriz es una generalización de la suma de cuadrados explicada por el grupo, y es una generalización de la suma de cuadrados residual . [3] [4]
Nótese que alternativamente también se podría hablar de covarianzas cuando las matrices mencionadas anteriormente se escalan por 1/(n-1) ya que las estadísticas de prueba posteriores no cambian al multiplicar y por la misma constante distinta de cero.
Las estadísticas más comunes [3] [5] son resúmenes basados en las raíces (o valores propios) de la matriz.
La raíz más grande de Roy (también llamada la raíz más grande de Roy ),
La discusión continúa sobre los méritos de cada una de ellas, [1] aunque la raíz más grande sólo conduce a un límite de significación que no suele tener interés práctico. Una complicación adicional es que, a excepción de la raíz más grande de Roy, la distribución de estas estadísticas bajo la hipótesis nula no es sencilla y sólo se puede aproximar excepto en unos pocos casos de baja dimensión. En [7] se derivó un algoritmo para la distribución de la raíz más grande de Roy bajo la hipótesis nula , mientras que en [8] se estudia la distribución bajo la alternativa.
En el caso de dos grupos, todas las estadísticas son equivalentes y la prueba se reduce al cuadrado T de Hotelling .
Introducción de covariables (MANCOVA)
También se puede comprobar si hay un efecto de grupo después de ajustar las covariables. Para ello, siga el procedimiento anterior pero sustituya con las predicciones del modelo lineal general , que contiene el grupo y las covariables, y sustituya con las predicciones del modelo lineal general que contiene solo las covariables (y una intersección). Luego, la suma adicional de cuadrados se explica agregando la información de agrupamiento y es la suma residual de cuadrados del modelo que contiene el agrupamiento y las covariables. [4]
Tenga en cuenta que en el caso de datos no balanceados, el orden de adición de las covariables importa.
Correlación de variables dependientes
La potencia del MANOVA se ve afectada por las correlaciones de las variables dependientes y por los tamaños del efecto asociados con esas variables. Por ejemplo, cuando hay dos grupos y dos variables dependientes, la potencia del MANOVA es mínima cuando la correlación es igual a la relación entre el tamaño del efecto estandarizado más pequeño y el más grande. [9]
^ abc Warne, RT (2014). "Una introducción al análisis multivariado de varianza (MANOVA) para científicos del comportamiento". Evaluación práctica, investigación y evaluación . 19 (17): 1–10.
^ Stevens, JP (2002). Estadística multivariante aplicada a las ciencias sociales. Mahwah, NJ: Lawrence Erblaum.
^ ab Anderson, TW (1994). Introducción al análisis estadístico multivariante . Wiley.
^ ab Krzanowski, WJ (1988). Principios del análisis multivariante. La perspectiva de un usuario . Oxford University Press.
^ UCLA: Servicios de tecnología académica, Grupo de consultoría estadística. «Stata Annotated Output – MANOVA» (Resultado anotado de Stata: MANOVA) . Consultado el 10 de febrero de 2024 .
^ "Conceptos básicos de MANOVA: estadísticas reales con Excel". www.real-statistics.com . Consultado el 5 de abril de 2018 .
^ Chiani, M. (2016), "Distribución de la raíz más grande de una matriz para la prueba de Roy en el análisis multivariado de varianza", Journal of Multivariate Analysis , 143 : 467–471, arXiv : 1401.3987v3 , doi : 10.1016/j.jmva.2015.10.007, S2CID 37620291
^ IM Johnstone, B. Nadler "La prueba de raíz más grande de Roy bajo alternativas de rango uno" preimpresión de arXiv arXiv:1310.6581 (2013)
^ Frane, Andrew (2015). "Control de potencia y error tipo I para comparaciones univariadas en diseños multivariados de dos grupos". Investigación conductual multivariada . 50 (2): 233–247. doi :10.1080/00273171.2014.968836. PMID 26609880. S2CID 1532673.
Enlaces externos
Wikiversidad tiene recursos de aprendizaje sobre el análisis multivariado de varianza.