Medida de bondad de ajuste en estadística
En estadística , la prueba K 2 de D'Agostino , llamada así por Ralph D'Agostino , es una medida de bondad de ajuste de la desviación de la normalidad , es decir, la prueba tiene como objetivo medir la compatibilidad de los datos dados con la hipótesis nula de que los datos son una realización de variables aleatorias gaussianas independientes e idénticamente distribuidas. La prueba se basa en transformaciones de la curtosis y asimetría de la muestra , y tiene potencia solo contra las alternativas de que la distribución sea sesgada y/o cúrtica.
Asimetría y curtosis
En lo que sigue, { x i } denota una muestra de n observaciones, g 1 y g 2 son la asimetría y la curtosis de la muestra , m j son los momentos centrales de la muestra j -ésima y es la media de la muestra . Con frecuencia en la literatura relacionada con las pruebas de normalidad , la asimetría y la curtosis se denotan como √ β 1 y β 2 respectivamente. Tal notación puede ser incómoda ya que, por ejemplo, √ β 1 puede ser una cantidad negativa.
La asimetría y la curtosis de la muestra se definen como
Estas cantidades estiman de manera consistente la asimetría y la curtosis teóricas de la distribución, respectivamente. Además, si la muestra proviene de una población normal, entonces las distribuciones de muestras finitas exactas de la asimetría y la curtosis pueden analizarse en términos de sus medias μ 1 , varianzas μ 2 , asimetrías γ 1 y curtosis γ 2 . Esto lo hizo Pearson (1931), quien derivó las siguientes expresiones: [ se necesita una mejor fuente ]
y
Por ejemplo, se puede esperar que una muestra con un tamaño n = 1000 extraída de una población con distribución normal tenga una asimetría de 0, DE 0,08 y una curtosis de 0, DE 0,15 , donde DE indica la desviación estándar. [ cita requerida ]
Asimetría y curtosis de la muestra transformada
La asimetría de la muestra g 1 y la curtosis g 2 son ambas asintóticamente normales. Sin embargo, la tasa de su convergencia al límite de distribución es frustrantemente lenta, especialmente para g 2 . Por ejemplo, incluso con n = 5000 observaciones, la curtosis de la muestra g 2 tiene una asimetría y una curtosis de aproximadamente 0,3, lo que no es despreciable. Para remediar esta situación, se ha sugerido transformar las cantidades g 1 y g 2 de una manera que haga que su distribución sea lo más cercana posible a la normal estándar.
En particular, D'Agostino y Pearson (1973) sugirieron la siguiente transformación para la asimetría de la muestra:
donde las constantes α y δ se calculan como
y donde μ 2 = μ 2 ( g 1 ) es la varianza de g 1 , y γ 2 = γ 2 ( g 1 ) es la curtosis — las expresiones dadas en la sección anterior.
De manera similar, Anscombe y Glynn (1983) sugirieron una transformación para g 2 , que funciona razonablemente bien para tamaños de muestra de 20 o más:
dónde
y μ 1 = μ 1 ( g 2 ), μ 2 = μ 2 ( g 2 ), γ 1 = γ 1 ( g 2 ) son las cantidades calculadas por Pearson.
GeneralK2estadística
Las estadísticas Z 1 y Z 2 se pueden combinar para producir una prueba ómnibus, capaz de detectar desviaciones de la normalidad debido a asimetría o curtosis (D'Agostino, Belanger y D'Agostino 1990):
Si la hipótesis nula de normalidad es verdadera, entonces K 2 tiene una distribución aproximada de χ 2 con 2 grados de libertad.
Nótese que las estadísticas g 1 , g 2 no son independientes, solo no están correlacionadas. Por lo tanto, sus transformadas Z 1 , Z 2 también serán dependientes (Shenton y Bowman 1977), lo que hace que la validez de la aproximación χ 2 sea cuestionable. Las simulaciones muestran que bajo la hipótesis nula, la estadística de prueba K 2 se caracteriza por
Véase también
Referencias
- Anscombe, FJ; Glynn, William J. (1983). "Distribución del estadístico de curtosis b 2 para estadísticos normales". Biometrika . 70 (1): 227–234. doi :10.1093/biomet/70.1.227. JSTOR 2335960.
- D'Agostino, Ralph B. (1970). "Transformación a normalidad de la distribución nula de g 1 ". Biometrika . 57 (3): 679–681. doi :10.1093/biomet/57.3.679. JSTOR 2334794.
- D'Agostino, Ralph B.; Pearson, ES (1973). "Pruebas de desviación de la normalidad. Resultados empíricos para las distribuciones de b 2 y √b 1 ". Biometrika . 60 (3): 613–622. JSTOR 2335012.
- D'Agostino, Ralph B.; Belanger, Albert; D'Agostino, Ralph B. Jr. (1990). "Una sugerencia para utilizar pruebas de normalidad potentes e informativas" (PDF) . The American Statistician . 44 (4): 316–321. doi :10.2307/2684359. JSTOR 2684359. Archivado desde el original (PDF) el 25 de marzo de 2012.
- Pearson, Egon S. (1931). "Nota sobre pruebas de normalidad". Biometrika . 22 (3/4): 423–424. doi :10.1093/biomet/22.3-4.423. JSTOR 2332104.
- Shenton, LR; Bowman, Kimiko O. (1977). "Un modelo bivariado para la distribución de √b 1 y b 2 ". Revista de la Asociación Estadounidense de Estadística . 72 (357): 206–211. doi :10.1080/01621459.1977.10479940. JSTOR 2286939.