Prueba de normalidad

En estadística , las pruebas de normalidad se utilizan para determinar si un conjunto de datos está bien modelado por una distribución normal y para calcular la probabilidad de que una variable aleatoria subyacente al conjunto de datos esté distribuida normalmente.

Más precisamente, las pruebas son una forma de selección de modelos y pueden interpretarse de varias maneras, dependiendo de las interpretaciones que cada uno tenga de la probabilidad :

En términos de estadística descriptiva , se mide la bondad del ajuste de un modelo normal a los datos: si el ajuste es deficiente, entonces los datos no están bien modelados en ese sentido por una distribución normal, sin hacer un juicio sobre ninguna variable subyacente.
En las pruebas de hipótesis estadísticas de estadística frecuentista , los datos se prueban frente a la hipótesis nula de que se distribuyen normalmente.
En las estadísticas bayesianas , uno no "prueba la normalidad" per se, sino que calcula la probabilidad de que los datos provengan de una distribución normal con parámetros dados μ , σ (para todos los μ , σ ), y compara eso con la probabilidad de que los datos provengan de otras distribuciones bajo consideración, simplemente usando un factor de Bayes (que da la probabilidad relativa de ver los datos dados diferentes modelos), o más finamente tomando una distribución previa sobre posibles modelos y parámetros y calculando una distribución posterior dadas las probabilidades calculadas.

Se utiliza una prueba de normalidad para determinar si los datos de la muestra se han extraído de una población con distribución normal (dentro de cierta tolerancia). Varias pruebas estadísticas, como la prueba t de Student y el ANOVA unidireccional y bidireccional, requieren una población de muestra con distribución normal.

Métodos gráficos

Un método informal para comprobar la normalidad consiste en comparar un histograma de los datos de la muestra con una curva de probabilidad normal. La distribución empírica de los datos (el histograma) debe tener forma de campana y parecerse a la distribución normal. Esto puede resultar difícil de ver si la muestra es pequeña. En este caso, se puede proceder a realizar una regresión de los datos frente a los cuantiles de una distribución normal con la misma media y varianza que la muestra. La falta de ajuste a la línea de regresión sugiere una desviación de la normalidad (véase el coeficiente de Anderson-Darling y Minitab).

Una herramienta gráfica para evaluar la normalidad es el gráfico de probabilidad normal , un gráfico cuantil-cuantil (gráfico QQ) de los datos estandarizados contra la distribución normal estándar . Aquí la correlación entre los datos de la muestra y los cuantiles normales (una medida de la bondad del ajuste) mide qué tan bien los datos son modelados por una distribución normal. Para los datos normales, los puntos graficados en el gráfico QQ deben caer aproximadamente en una línea recta, lo que indica una alta correlación positiva. Estos gráficos son fáciles de interpretar y también tienen la ventaja de que los valores atípicos se identifican fácilmente.

Prueba de cálculo aproximado

Una prueba simple de cálculo aproximado toma el máximo y el mínimo de la muestra y calcula su puntuación z , o más apropiadamente , la estadística t (número de desviaciones estándar de la muestra en las que una muestra está por encima o por debajo de la media de la muestra), y la compara con la regla 68-95-99,7 : si uno tiene un evento de 3 σ (apropiadamente, un evento de 3 s ) y sustancialmente menos de 300 muestras, o un evento de 4 s y sustancialmente menos de 15 000 muestras, entonces una distribución normal subestimará la magnitud máxima de las desviaciones en los datos de la muestra.

Esta prueba es útil en casos en los que uno enfrenta un riesgo de curtosis (donde las grandes desviaciones son importantes) y tiene la ventaja de que es muy fácil de calcular y comunicar: los no estadísticos pueden comprender fácilmente que "los eventos de 6 σ son muy raros en distribuciones normales".

Pruebas frecuentistas

Las pruebas de normalidad univariante incluyen las siguientes:

Prueba K-cuadrado de D'Agostino ,
Prueba de Jarque-Bera ,
Prueba de Anderson -Darling
Criterio de Cramér-von Mises ,
Prueba de Kolmogorov-Smirnov : esta prueba solo funciona si se supone que la media y la varianza de la distribución normal se conocen bajo la hipótesis nula.
Prueba de Lilliefors : basada en la prueba de Kolmogorov-Smirnov, ajustada para cuando también se estima la media y la varianza a partir de los datos,
Prueba de Shapiro-Wilk , y
Prueba de chi-cuadrado de Pearson .

Un estudio de 2011 concluye que Shapiro-Wilk tiene el mejor poder para una significancia dada, seguido de cerca por Anderson-Darling al comparar las pruebas de Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors y Anderson-Darling. ^[1]

Algunos trabajos publicados recomiendan la prueba de Jarque-Bera, ^[2]^[3] pero la prueba tiene debilidades. En particular, la prueba tiene baja potencia para distribuciones con colas cortas, especialmente para distribuciones bimodales. ^[4] Algunos autores se han negado a incluir sus resultados en sus estudios debido a su pobre desempeño general. ^[5]

Históricamente, los momentos estandarizados tercero y cuarto ( asimetría y curtosis ) fueron algunas de las primeras pruebas de normalidad. La prueba de Lin-Mudholkar apunta específicamente a alternativas asimétricas. ^[6] La prueba de Jarque-Bera se deriva de estimaciones de asimetría y curtosis . Las pruebas multivariadas de asimetría y curtosis de Mardia generalizan las pruebas de momento al caso multivariado. ^{[7] Otras}estadísticas de prueba tempranas incluyen la relación entre la desviación absoluta media y la desviación estándar y entre el rango y la desviación estándar. ^[8]

Las pruebas de normalidad más recientes incluyen la prueba de energía ^[9] (Székely y Rizzo) y las pruebas basadas en la función característica empírica (ECF) (por ejemplo, Epps y Pulley, ^[10] Henze–Zirkler, ^[11] prueba BHEP ^[12] ). Las pruebas de energía y ECF son pruebas poderosas que se aplican para probar la normalidad univariante o multivariante y son estadísticamente consistentes contra alternativas generales.

La distribución normal tiene la entropía más alta de todas las distribuciones para una desviación estándar dada. Hay varias pruebas de normalidad basadas en esta propiedad, la primera de las cuales se atribuye a Vasicek. ^[13]

Pruebas bayesianas

Las divergencias de Kullback-Leibler entre todas las distribuciones posteriores de la pendiente y la varianza no indican no normalidad. Sin embargo, la razón de las expectativas de estas posteriores y la esperanza de las razones dan resultados similares a la estadística de Shapiro-Wilk, excepto para muestras muy pequeñas, cuando se utilizan valores previos no informativos. ^[14]

Spiegelhalter sugiere utilizar un factor de Bayes para comparar la normalidad con una clase diferente de alternativas distribucionales. ^[15] Este enfoque ha sido ampliado por Farrell y Rogers-Stewart. ^[16]

Aplicaciones

Una aplicación de las pruebas de normalidad es a los residuos de un modelo de regresión lineal . ^[17] Si no se distribuyen normalmente, los residuos no deben utilizarse en pruebas Z ni en ninguna otra prueba derivada de la distribución normal, como las pruebas t , las pruebas F y las pruebas de chi-cuadrado . Si los residuos no se distribuyen normalmente, entonces la variable dependiente o al menos una variable explicativa puede tener la forma funcional incorrecta, o pueden faltar variables importantes, etc. La corrección de uno o más de estos errores sistemáticos puede producir residuos que se distribuyan normalmente; en otras palabras, la no normalidad de los residuos es a menudo una deficiencia del modelo en lugar de un problema de datos. ^[18]

Véase también

Notas

^ Razali, Nornadiah; Wah, Yap Bee (2011). "Comparaciones de potencia de las pruebas Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors y Anderson–Darling" (PDF) . Revista de modelado estadístico y análisis . 2 (1): 21–33. Archivado desde el original (PDF) el 2015-06-30.
^ Judge, George G.; Griffiths, WE; Hill, R. Carter; Lütkepohl, Helmut ; Lee, T. (1988). Introducción a la teoría y la práctica de la econometría (segunda edición). Wiley. págs. 890–892. ISBN 978-0-471-08277-4.
^ Gujarati, Damodar N. (2002). Econometría básica (cuarta edición). McGraw Hill. págs. 147-148. ISBN 978-0-07-123017-9.
^ Thadewald, Thorsten; Büning, Herbert (1 de enero de 2007). "Prueba de Jarque–Bera y sus competidores para probar la normalidad: una comparación de potencia". Revista de estadística aplicada . 34 (1): 87–105. CiteSeerX 10.1.1.507.1186 . doi :10.1080/02664760600994539. S2CID 13866566.
^ Sürücü, Barış (1 de septiembre de 2008). "Un estudio de simulación y comparación de potencia de pruebas de bondad de ajuste". Computers & Mathematics with Applications . 56 (6): 1617–1625. doi : 10.1016/j.camwa.2008.03.010 .
^ Lin, CC; Mudholkar, GS (1980). "Una prueba simple de normalidad frente a alternativas asimétricas". Biometrika . 67 (2): 455–461. doi :10.1093/biomet/67.2.455.
^ Mardia, KV (1970). Medidas de asimetría y curtosis multivariadas con aplicaciones. Biometrika 57, 519–530.
^ Filliben, JJ (febrero de 1975). "La prueba del coeficiente de correlación de la gráfica de probabilidad para la normalidad". Technometrics . 17 (1): 111–117. doi :10.2307/1268008. JSTOR 1268008.
^ Székely, GJ y Rizzo, ML (2005) Una nueva prueba para la normalidad multivariada, Journal of Multivariate Analysis 93, 58–80.
^ Epps, TW y Pulley, LB (1983). Una prueba de normalidad basada en la función característica empírica. Biometrika 70, 723–726.
^ Henze, N. y Zirkler, B. (1990). Una clase de pruebas invariantes y consistentes para la normalidad multivariante. Communications in Statistics – Theory and Methods 19, 3595–3617.
^ Henze, N., y Wagner, T. (1997). Un nuevo enfoque para las pruebas BHEP de normalidad multivariada. Journal of Multivariate Analysis 62, 1–23.
^ Vasicek, Oldrich (1976). "Una prueba de normalidad basada en la entropía de la muestra". Revista de la Royal Statistical Society . Serie B (Metodológica). 38 (1): 54–59. JSTOR 2984828.
^ Young KDS (1993), "Diagnóstico bayesiano para comprobar supuestos de normalidad". Journal of Statistical Computation and Simulation , 47 (3–4),167–180
^ Spiegelhalter, DJ (1980). Una prueba ómnibus de normalidad para muestras pequeñas. Biometrika, 67, 493–496. doi :10.1093/biomet/67.2.493
^ Farrell, PJ, Rogers-Stewart, K. (2006) "Estudio exhaustivo de pruebas de normalidad y simetría: extensión de la prueba de Spiegelhalter". Journal of Statistical Computation and Simulation , 76(9), 803 – 816. doi :10.1080/10629360500109023
^ Portney, LG y Watkins, MP (2000). Fundamentos de la investigación clínica: aplicaciones a la práctica . Nueva Jersey: Prentice Hall Health. págs. 516-517. ISBN 0838526950.{{cite book}}: CS1 maint: varios nombres: lista de autores ( enlace )
^ Pek, Jolynn; Wong, Octavia; Wong, Augustine CM (6 de noviembre de 2018). "Cómo abordar la no normalidad: una taxonomía de enfoques, revisada e ilustrada". Frontiers in Psychology . 9 : 2104. doi : 10.3389/fpsyg.2018.02104 . ISSN 1664-1078. PMC 6232275 . PMID 30459683.

Lectura adicional

Ralph B. D'Agostino (1986). "Pruebas para la distribución normal". En D'Agostino, RB; Stephens, MA (eds.). Técnicas de bondad de ajuste . Nueva York: Marcel Dekker. ISBN 978-0-8247-7487-5.

Henry C. Thode, Jr. (2002). Pruebas de normalidad . Nueva York: Marcel Dekker, Inc., págs. 479. ISBN 978-0-8247-9613-6.