stringtranslate.com

Prueba de Brown-Forsythe

La prueba de Brown-Forsythe es una prueba estadística para la igualdad de varianzas grupales basada en la realización de un Análisis de Varianza (ANOVA) sobre una transformación de la variable de respuesta . Cuando se realiza un ANOVA unidireccional , se supone que las muestras se extrajeron de distribuciones con igual varianza . Si esta suposición no es válida, la prueba F resultante no es válida. El estadístico de prueba de Brown-Forsythe es el estadístico F resultante de un análisis de varianza unidireccional ordinario sobre las desviaciones absolutas de los datos de los grupos o tratamientos de sus medianas individuales. [1]

Transformación

La variable de respuesta transformada se construye para medir la dispersión en cada grupo. Dejar

¿ Dónde está la mediana del grupo j ? El estadístico de prueba de Brown-Forsythe es el estadístico F del modelo de un ANOVA unidireccional en z ij :

donde p es el número de grupos, n j es el número de observaciones en el grupo j y N es el número total de observaciones. También son las medias grupales de y es la media general de . Este estadístico F sigue la distribución F con grados de libertad y bajo la hipótesis nula.

Si las varianzas son realmente heterogéneas, se pueden utilizar técnicas que lo permitan (como el ANOVA unidireccional de Welch) en lugar del ANOVA habitual.

Good, [2] al observar que las desviaciones son linealmente dependientes, modificó la prueba para eliminar las desviaciones redundantes.

Comparación con la prueba de Levene

La prueba de Levene utiliza la media en lugar de la mediana. Aunque la elección óptima depende de la distribución subyacente, se recomienda la definición basada en la mediana como la elección que proporciona buena solidez frente a muchos tipos de datos no normales y al mismo tiempo conserva un buen poder estadístico . [3] Si uno tiene conocimiento de la distribución subyacente de los datos, esto puede indicar que se utiliza una de las otras opciones. Brown y Forsythe [4] realizaron estudios de Monte Carlo que indicaron que el uso de la media recortada funcionaba mejor cuando los datos subyacentes seguían una distribución de Cauchy (una distribución de cola pesada ) y la mediana funcionaba mejor cuando los datos subyacentes seguían una distribución χ 2 con cuatro grados de libertad (una distribución muy sesgada ). El uso de la media proporcionó la mejor potencia para distribuciones simétricas de cola moderada. O'Brien probó varias formas de utilizar el análisis de varianza tradicional para probar la heterogeneidad de la dispersión en diseños factoriales con tamaños de muestra iguales o desiguales. Se ha demostrado que los pseudovalores jackknife de s 2 y las desviaciones absolutas de la mediana celular son robustos y relativamente potentes. [5]

Ver también

Referencias

  1. ^ "Función plot.hov | Documentación de R". www.rdocumentation.org . Campamento de datos.
  2. ^ Bien, PI (2005). Pruebas de hipótesis de permutación, paramétricas y bootstrap (3ª ed.). Nueva York: Springer.
  3. ^ Torre de perforación, B; Ruck, A; Al rebaño; Blanco, P (2018). "Pruebas de igualdad de varianzas entre dos muestras que contienen observaciones pareadas y observaciones independientes" (PDF) . Revista de métodos cuantitativos aplicados . 13 (2): 36–47.
  4. ^ Marrón, Morton B.; Forsythe, Alan B. (1974). "Pruebas robustas de igualdad de varianzas". Revista de la Asociación Estadounidense de Estadística . 69 (346): 364–367. doi :10.1080/01621459.1974.10482955. JSTOR  2285659.
  5. ^ O'Brien, RG (1978). "Técnicas sólidas para probar la heterogeneidad de los efectos de la varianza en diseños factoriales". Psicometrika . 43 (3): 327–342. doi :10.1007/BF02293643.

enlaces externos

Dominio publico Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.