stringtranslate.com

prueba de Grubbs

En estadística, la prueba de Grubbs o prueba de Grubbs (llamada así por Frank E. Grubbs , quien publicó la prueba en 1950 [1] ), también conocida como prueba residual máxima normalizada o prueba de desviación estudentizada extrema , es una prueba utilizada para detectar valores atípicos en un conjunto de datos univariados que se supone provienen de una población distribuida normalmente .

Definición

La prueba de Grubbs se basa en el supuesto de normalidad . Es decir, primero se debe verificar que los datos puedan aproximarse razonablemente mediante una distribución normal antes de aplicar la prueba de Grubbs. [2]

La prueba de Grubbs detecta un valor atípico a la vez. Este valor atípico se elimina del conjunto de datos y la prueba se repite hasta que no se detectan valores atípicos. Sin embargo, las iteraciones múltiples cambian las probabilidades de detección y la prueba no debe usarse para tamaños de muestra de seis o menos, ya que con frecuencia etiqueta la mayoría de los puntos como valores atípicos. [3]

La prueba de Grubbs se define para las siguientes hipótesis :

H 0 : No hay valores atípicos en el conjunto de datos.
H a : Hay exactamente un valor atípico en el conjunto de datos.

El estadístico de la prueba de Grubbs se define como

con y denotando la media muestral y la desviación estándar , respectivamente. El estadístico de la prueba de Grubbs es la desviación absoluta más grande de la media muestral en unidades de la desviación estándar muestral.

Esta es la prueba bilateral , para la cual la hipótesis de que no hay valores atípicos se rechaza en el nivel de significancia α si

donde t α/(2 N ), N −2 denota el valor crítico superior de la distribución t con N  − 2 grados de libertad y un nivel de significancia de α/(2 N ).

Caso unilateral

La prueba de Grubbs también se puede definir como una prueba unilateral, reemplazando α/(2 N ) con α/ N . Para comprobar si el valor mínimo es un valor atípico, el estadístico de prueba es

donde Y min denota el valor mínimo. Para comprobar si el valor máximo es un valor atípico, el estadístico de prueba es

donde Y max denota el valor máximo.

Técnicas relacionadas

Se pueden utilizar varias técnicas gráficas para detectar valores atípicos. Un diagrama de secuencia simple , un diagrama de caja o un histograma deberían mostrar los puntos obviamente atípicos. También puede resultar útil un gráfico de probabilidad normal .

Ver también

Referencias

  1. ^ Grubbs, Frank E. (1950). "Criterios de muestra para probar observaciones alejadas". Anales de Estadística Matemática . 21 (1): 27–58. doi : 10.1214/aoms/1177729885 . hdl : 2027.42/182780 .
  2. ^ Citado del Manual de ingeniería y estadística , párrafo 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
  3. ^ Adikaram, KKLB; Hussein, MA; Effenberger, M.; Becker, T. (14 de enero de 2015). "Técnica de transformación de datos para mejorar el poder de detección de valores atípicos de la prueba de Grubbs para datos que se espera que sigan una relación lineal". Revista de Matemáticas Aplicadas . 2015 : 1–9. doi : 10.1155/2015/708948 .

Otras lecturas

Dominio publico Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.