En estadística, la prueba de Grubbs o prueba de Grubbs (llamada así por Frank E. Grubbs , quien publicó la prueba en 1950 [1] ), también conocida como prueba residual máxima normalizada o prueba de desviación estudentizada extrema , es una prueba utilizada para detectar valores atípicos en un conjunto de datos univariados que se supone provienen de una población distribuida normalmente .
La prueba de Grubbs se basa en el supuesto de normalidad . Es decir, primero se debe verificar que los datos puedan aproximarse razonablemente mediante una distribución normal antes de aplicar la prueba de Grubbs. [2]
La prueba de Grubbs detecta un valor atípico a la vez. Este valor atípico se elimina del conjunto de datos y la prueba se repite hasta que no se detectan valores atípicos. Sin embargo, las iteraciones múltiples cambian las probabilidades de detección y la prueba no debe usarse para tamaños de muestra de seis o menos, ya que con frecuencia etiqueta la mayoría de los puntos como valores atípicos. [3]
La prueba de Grubbs se define para las siguientes hipótesis :
El estadístico de la prueba de Grubbs se define como
con y denotando la media muestral y la desviación estándar , respectivamente. El estadístico de la prueba de Grubbs es la desviación absoluta más grande de la media muestral en unidades de la desviación estándar muestral.
Esta es la prueba bilateral , para la cual la hipótesis de que no hay valores atípicos se rechaza en el nivel de significancia α si
donde t α/(2 N ), N −2 denota el valor crítico superior de la distribución t con N − 2 grados de libertad y un nivel de significancia de α/(2 N ).
La prueba de Grubbs también se puede definir como una prueba unilateral, reemplazando α/(2 N ) con α/ N . Para comprobar si el valor mínimo es un valor atípico, el estadístico de prueba es
donde Y min denota el valor mínimo. Para comprobar si el valor máximo es un valor atípico, el estadístico de prueba es
donde Y max denota el valor máximo.
Se pueden utilizar varias técnicas gráficas para detectar valores atípicos. Un diagrama de secuencia simple , un diagrama de caja o un histograma deberían mostrar los puntos obviamente atípicos. También puede resultar útil un gráfico de probabilidad normal .
Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.