Prueba de Grubbs

En estadística, la prueba de Grubbs o prueba de Grubbs (nombrada en honor a Frank E. Grubbs , quien publicó la prueba en 1950 ^[1] ), también conocida como prueba de residuo normalizado máximo o prueba de desviación estudentizada extrema , es una prueba utilizada para detectar valores atípicos en un conjunto de datos univariados que se supone provienen de una población distribuida normalmente .

Definición

La prueba de Grubbs se basa en el supuesto de normalidad . Es decir, antes de aplicar la prueba de Grubbs se debe verificar que los datos se puedan aproximar razonablemente mediante una distribución normal. ^[2]

La prueba de Grubbs detecta un valor atípico a la vez. Este valor atípico se elimina del conjunto de datos y la prueba se repite hasta que no se detectan valores atípicos. Sin embargo, varias iteraciones cambian las probabilidades de detección y la prueba no se debe utilizar para tamaños de muestra de seis o menos, ya que con frecuencia etiqueta la mayoría de los puntos como valores atípicos. ^[3]

La prueba de Grubbs se define para las siguientes hipótesis :

H ₀ : No hay valores atípicos en el conjunto de datos

H _a : Hay exactamente un valor atípico en el conjunto de datos

La estadística de prueba de Grubbs se define como

G={\frac {\displaystyle \max _{i=1,\ldots ,N}\left\vert Y_{i}-{\bar {Y}}\right\vert }{s}}

donde y denotan la media de la muestra y la desviación estándar , respectivamente. La estadística de prueba de Grubbs es la desviación absoluta más grande de la media de la muestra en unidades de la desviación estándar de la muestra. ${\overline {Y}}$ ${\estilo de visualización s}$

Esta es la prueba de dos colas , para la cual se rechaza la hipótesis de que no hay valores atípicos en el nivel de significancia α si

G>{\frac {N-1}{\sqrt {N}}}{\sqrt {\frac {t_{\alpha /(2N),N-2}^{2}}{N-2 +t_{\alfa /(2N),N-2}^{2}}}}

con t _{α/(2 N ), N −2} denota el valor crítico superior de la distribución t con N − 2 grados de libertad y un nivel de significancia de α/(2 N ).

Caso unilateral

La prueba de Grubbs también se puede definir como una prueba unilateral, reemplazando α/(2 N ) por α/ N . Para probar si el valor mínimo es un valor atípico, la estadística de prueba es

G={\frac {{\bar {Y}}-Y_{\min }}{s}}

donde Y _min denota el valor mínimo. Para comprobar si el valor máximo es un valor atípico, la estadística de prueba es

G={\frac {Y_{\max }-{\bar {Y}}}{s}}

donde Y _max denota el valor máximo.

Técnicas relacionadas

Se pueden utilizar varias técnicas gráficas para detectar valores atípicos. Un gráfico de secuencia de series simple , un gráfico de cajas o un histograma deberían mostrar los puntos claramente atípicos. Un gráfico de probabilidad normal también puede ser útil.

Véase también

Referencias

^ Grubbs, Frank E. (1950). "Criterios de muestra para probar observaciones atípicas". Anales de estadística matemática . 21 (1): 27–58. doi : 10.1214/aoms/1177729885 . hdl : 2027.42/182780 .
^ Citado del Manual de ingeniería y estadística , párrafo 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
^ Adikaram, KKLB; Hussein, MA; Effenberger, M.; Becker, T. (14 de enero de 2015). "Técnica de transformación de datos para mejorar el poder de detección de valores atípicos de la prueba de Grubbs para datos que se espera que sigan una relación lineal". Journal of Applied Mathematics . 2015 : 1–9. doi : 10.1155/2015/708948 .

Lectura adicional

Grubbs, Frank (febrero de 1969). "Procedimientos para detectar observaciones atípicas en muestras". Technometrics . 11 (1). Technometrics, vol. 11, núm. 1: 2–21. doi :10.2307/1266761. JSTOR 1266761.
Stefansky, W. (1972). "Rechazo de valores atípicos en diseños factoriales". Technometrics . 14 (2). Technometrics, vol. 14, núm. 2: 469–479. doi :10.2307/1267436. JSTOR 1267436.

Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.