Criterio de Cramér-von Mises

En estadística el criterio de Cramér-von Mises se emplea para juzgar la bondad de una función de distribución acumulada

comparada con una función de distribución empírica

{\displaystyle F_{n}}

, o para comparar dos distribuciones empíricas.

También se utiliza como parte de otros algoritmos, tal como la estimación de la distancia mínima.

Se define como: Aplicándolo a una única muestra,

es la distribución teórica y

Alternativamente las dos distribuciones pueden ser estimadas empíricamente; esto se conoce como un caso de dos muestras.

El criterio lleva los apellidos de Harald Cramér y Richard Edler von Mises, quienes fueron los primeros en exponerlo entre los años 1928-1930.

La generalización de las dos muestras es obra de Theodore Wilbur Anderson.

[1] El criterio es una alternativa al test de Kolmogorov-Smirnov.

Sean

los valores observados, en orden creciente.

Entonces el estadístico es[1]: 1153 [2] Si este valor es mayor que el valor tabulado, se puede rechazar la hipótesis de que los datos provienen de la distribución

Una versión modificada del criterio es el test de Watson,[3] el cual usa el estadístico U2, donde[2] donde Sean

los valores observados en la primera y segunda muestra respectivamente, en orden creciente.

Sean

los rangos de x en la muestra combinada, y sean

los rangos de y en la muestra combinada.

Anderson[1]: 1149 muestra que donde U se define como Si el valor de T es mayor que los valores tabulados,[1]: 1154–1159 se puede rechazar la hipótesis de que las dos muestras provienen de la misma distribución.

Esto implica que no hay duplicados en

, y en las secuencias

es única, y su rango es

Si hay duplicados, y

son valores idénticos, donde se puede utilizar el enfoque del medio rango[4] método: asignar a cada duplicado un rango de

( i + j )

En las ecuaciones precedentes, en las expresiones

, los duplicados pueden alterar las cuatro variables