stringtranslate.com

prueba de kuiper

La prueba de Kuiper se utiliza en estadística para comprobar si una muestra de datos proviene de una distribución determinada (prueba de Kuiper de una muestra) o si dos muestras de datos provienen de la misma distribución desconocida (prueba de Kuiper de dos muestras). Lleva el nombre del matemático holandés Nicolaas Kuiper . [1]

La prueba de Kuiper está estrechamente relacionada con la más conocida prueba de Kolmogorov-Smirnov (o prueba KS, como se la suele llamar). Al igual que con la prueba KS, las estadísticas de discrepancia D + y D representan los tamaños absolutos de las diferencias más positivas y más negativas entre las dos funciones de distribución acumulativa que se están comparando. El truco de la prueba de Kuiper consiste en utilizar la cantidad D +  +  D como estadístico de prueba. Este pequeño cambio hace que la prueba de Kuiper sea tan sensible en las colas como en la mediana y también la hace invariante ante transformaciones cíclicas de la variable independiente. La prueba de Anderson-Darling es otra prueba que proporciona la misma sensibilidad en las colas que la mediana, pero no proporciona la invariancia cíclica.

Esta invariancia bajo transformaciones cíclicas hace que la prueba de Kuiper sea invaluable cuando se prueban variaciones cíclicas por época del año, día de la semana o hora del día y, de manera más general, para probar el ajuste y las diferencias entre distribuciones de probabilidad circulares .

Prueba de Kuiper de una muestra

Ilustración del estadístico de la prueba de Kuiper de dos muestras. Las líneas roja y azul corresponden cada una a una función de distribución empírica, y las flechas negras muestran las distancias de los puntos que suman la estadística de Kuiper.

El estadístico de prueba de una muestra, , para la prueba de Kuiper se define de la siguiente manera. Sea F la función de distribución acumulativa continua que será la hipótesis nula . Denotemos por F n la función de distribución empírica para n observaciones X i independientes e idénticamente distribuidas (iid) , que se define como

donde está la función indicadora , igual a 1 si e igual a 0 en caso contrario.

Entonces, el estadístico unilateral de Kolmogorov-Smirnov para la función de distribución acumulativa dada F ( x ) es

¿Dónde está la función suprema ? Y finalmente la prueba de Kuiper de una muestra se define como,

o equivalente

¿Dónde está la función mínima ?

Se encuentran disponibles tablas para los puntos críticos de la estadística de prueba , [2] y estas incluyen ciertos casos en los que la distribución que se está probando no se conoce completamente, por lo que se estiman los parámetros de la familia de distribuciones .

La distribución asintótica del estadístico viene dada por, [1]

Para , se obtiene una aproximación razonable a partir del primer término de la serie de la siguiente manera

Prueba de Kuiper de dos muestras

La prueba de Kuiper también se puede utilizar para probar si un par de muestras aleatorias, ya sea en la línea real o en el círculo, provienen de una distribución común pero desconocida. En este caso, el estadístico de Kuiper es

donde y son las funciones de distribución empírica de la primera y segunda muestra respectivamente, es la función suprema y es la función mínima .

Ejemplo

Podríamos probar la hipótesis de que las computadoras fallan más durante algunas épocas del año que otras. Para probar esto, recopilaríamos las fechas en las que el conjunto de computadoras de prueba había fallado y construiríamos una función de distribución empírica . La hipótesis nula es que las fallas se distribuyen uniformemente . La estadística de Kuiper no cambia si cambiamos el comienzo del año y no requiere que clasifiquemos los fallos en meses o cosas similares. [1] [3] Otro estadístico de prueba que tiene esta propiedad es el estadístico de Watson, [3] [4] que está relacionado con la prueba de Cramér-von Mises .

Sin embargo, si las fallas ocurren principalmente los fines de semana, muchas pruebas de distribución uniforme, como KS y Kuiper, no lo pasarían, ya que los fines de semana se distribuyen a lo largo del año. Esta incapacidad para distinguir distribuciones con forma de peine de distribuciones uniformes continuas es un problema clave en todas las estadísticas basadas en una variante de la prueba KS. La prueba de Kuiper, aplicada al módulo de tiempos de eventos de una semana, es capaz de detectar dicho patrón. El uso de tiempos de eventos que se han modulado con la prueba KS puede generar resultados diferentes dependiendo de cómo se escalonen los datos. En este ejemplo, la prueba KS puede detectar la falta de uniformidad si los datos están configurados para comenzar la semana en sábado, pero no detecta la falta de uniformidad si la semana comienza el miércoles.

Ver también

Referencias

  1. ^ abc Kuiper, Nueva Hampshire (1960). "Pruebas relativas a puntos aleatorios de un círculo". Actas de la Koninklijke Nederlandse Akademie van Wetenschappen, Serie A. 63 : 38–47.
  2. ^ Pearson, ES , Hartley, HO (1972) Tablas biometrika para estadísticos, volumen 2 , CUP. ISBN 0-521-06937-8 (Tabla 54) 
  3. ^ ab Watson, GS (1961) "Pruebas de bondad de ajuste en un círculo", Biometrika , 48 (1/2), 109–114 JSTOR  2333135
  4. ^ Pearson, ES , Hartley, HO (1972) Tablas biometrika para estadísticos, volumen 2 , CUP. ISBN 0-521-06937-8 (Página 118)