stringtranslate.com

Prueba de Kuiper

La prueba de Kuiper se utiliza en estadística para comprobar si una muestra de datos procede de una distribución dada (prueba de Kuiper de una muestra) o si dos muestras de datos proceden de la misma distribución desconocida (prueba de Kuiper de dos muestras). Recibe su nombre en honor al matemático holandés Nicolaas Kuiper . [1]

La prueba de Kuiper está estrechamente relacionada con la más conocida prueba de Kolmogorov-Smirnov (o prueba KS , como se la suele llamar). Al igual que con la prueba KS, las estadísticas de discrepancia D + y D− representan los tamaños absolutos de las diferencias más positivas y más negativas entre las dos funciones de distribución acumulativa que se están comparando. El truco con la prueba de Kuiper es utilizar la cantidad D +  +  D− como la estadística de prueba. Este pequeño cambio hace que la prueba de Kuiper sea tan sensible en las colas como en la mediana y también la hace invariante bajo transformaciones cíclicas de la variable independiente. La prueba de Anderson-Darling es otra prueba que proporciona la misma sensibilidad en las colas que la mediana, pero no proporciona la invariancia cíclica.

Esta invariancia bajo transformaciones cíclicas hace que la prueba de Kuiper sea invaluable para probar variaciones cíclicas por época del año o día de la semana u hora del día, y más generalmente para probar el ajuste y las diferencias entre distribuciones de probabilidad circulares .

Prueba de Kuiper de una muestra

Ilustración del estadístico de la prueba de Kuiper de dos muestras. Las líneas roja y azul corresponden a una función de distribución empírica y las flechas negras muestran las distancias de los puntos que suman el estadístico de Kuiper.

La estadística de prueba de una muestra, , para la prueba de Kuiper se define de la siguiente manera. Sea F la función de distribución acumulativa continua que será la hipótesis nula . Denotemos por F n la función de distribución empírica para n observaciones independientes e idénticamente distribuidas (iid) X i , que se define como

donde es la función indicadora , igual a 1 si e igual a 0 en caso contrario.

Entonces, la estadística de Kolmogorov-Smirnov unilateral para la función de distribución acumulativa dada F ( x ) es

donde es la función suprema . Y finalmente la prueba de Kuiper de una muestra se define como,

o equivalentemente

¿Dónde está la función ínfima ?

Se encuentran disponibles tablas para los puntos críticos de la estadística de prueba , [2] y estas incluyen ciertos casos donde la distribución que se está probando no se conoce completamente, de modo que se estiman los parámetros de la familia de distribuciones .

La distribución asintótica de la estadística está dada por, [1]

Para , se obtiene una aproximación razonable a partir del primer término de la serie como sigue

Prueba de Kuiper de dos muestras

La prueba de Kuiper también se puede utilizar para comprobar si un par de muestras aleatorias, ya sea en la línea real o en el círculo, provienen de una distribución común pero desconocida. En este caso, la estadística de Kuiper es

donde y son las funciones de distribución empírica de la primera y la segunda muestra respectivamente, es la función suprema y es la función ínfima .

Ejemplo

Podríamos probar la hipótesis de que las computadoras fallan más durante algunas épocas del año que en otras. Para probar esto, recopilaríamos las fechas en las que el conjunto de computadoras de prueba había fallado y construiríamos una función de distribución empírica . La hipótesis nula es que las fallas se distribuyen uniformemente . La estadística de Kuiper no cambia si cambiamos el comienzo del año y no requiere que clasifiquemos las fallas en meses o similares. [1] [3] Otra estadística de prueba que tiene esta propiedad es la estadística de Watson, [3] [4] que está relacionada con la prueba de Cramér–von Mises .

Sin embargo, si las fallas ocurren principalmente los fines de semana, muchas pruebas de distribución uniforme como KS y Kuiper no lo detectarían, ya que los fines de semana se distribuyen a lo largo del año. Esta incapacidad para distinguir distribuciones con forma de peine de distribuciones uniformes continuas es un problema clave con todas las estadísticas basadas en una variante de la prueba KS. La prueba de Kuiper, aplicada a los tiempos de los eventos módulo una semana, es capaz de detectar dicho patrón. El uso de tiempos de eventos que se han modulado con la prueba KS puede dar como resultado diferentes resultados según cómo se distribuyan los datos por fases. En este ejemplo, la prueba KS puede detectar la falta de uniformidad si los datos están configurados para comenzar la semana el sábado, pero no detectar la falta de uniformidad si la semana comienza el miércoles.

Véase también

Referencias

  1. ^ abc Kuiper, Nueva Hampshire (1960). "Pruebas relativas a puntos aleatorios de un círculo". Actas de la Koninklijke Nederlandse Akademie van Wetenschappen, Serie A. 63 : 38–47.
  2. ^ Pearson, ES , Hartley, HO (1972) Tablas de Biometrika para estadísticos, volumen 2 , CUP. ISBN 0-521-06937-8 (Tabla 54) 
  3. ^ ab Watson, GS (1961) "Pruebas de bondad de ajuste en un círculo", Biometrika , 48 (1/2), 109–114 JSTOR  2333135
  4. ^ Pearson, ES , Hartley, HO (1972) Tablas Biometrika para estadísticos, volumen 2 , CUP. ISBN 0-521-06937-8 (página 118)