Criterio de Cramér-von Mises

En estadística, el criterio de Cramér–von Mises es un criterio utilizado para juzgar la bondad del ajuste de una función de distribución acumulativa en comparación con una función de distribución empírica dada , o para comparar dos distribuciones empíricas. También se utiliza como parte de otros algoritmos, como la estimación de la distancia mínima . Se define como $Estilo de visualización F*$ $Estilo de visualización F_{n}$

\omega ^{2}=\int _{-\infty }^{\infty }[F_{n}(x)-F^{*}(x)]^{2}\,\mathrm { d}F^{*}(x)

En aplicaciones de una sola muestra, es la distribución teórica y es la distribución observada empíricamente . Alternativamente, las dos distribuciones pueden ser estimadas empíricamente; esto se denomina caso de dos muestras. $Estilo de visualización F*$ $Estilo de visualización F_{n}$

El criterio recibe su nombre de Harald Cramér y Richard Edler von Mises, quienes lo propusieron por primera vez entre 1928 y 1930. ^[1]^[2] La generalización a dos muestras se debe a Anderson . ^[3]

La prueba de Cramér-von Mises es una alternativa a la prueba de Kolmogorov-Smirnov (1933). ^[4]

Prueba de Cramér-von Mises (una muestra)

Sean los valores observados, en orden creciente. Entonces el estadístico es ^[3]^{: 1153}^[5] $x_{1},x_{2},\ldots ,x_{n}$

T=n\omega ^{2}={\frac {1}{12n}}+\sum _{i=1}^{n}\left[{\frac {2i-1}{2n}}-F(x_{i})\right]^{2}.

Si este valor es mayor que el valor tabulado, entonces se puede rechazar la hipótesis de que los datos provienen de la distribución. ${\estilo de visualización F}$

Prueba Watson

Una versión modificada de la prueba de Cramér-von Mises es la prueba Watson ^[6] que utiliza el estadístico U ² , donde ^[5]

U^{2}=Tn({\bar {F}}-{\tfrac {1}{2}})^{2},

dónde

{\bar {F}}={\frac {1}{n}}\sum _{i=1}^{n}F(x_{i}).

Prueba de Cramér-von Mises (dos muestras)

Sean y los valores observados en la primera y segunda muestra respectivamente, en orden creciente. Sean los rangos de las x en la muestra combinada y sean los rangos de las y en la muestra combinada. Anderson ^[3]^{: 1149} muestra que $x_{1},x_{2},\ldots ,x_{N}$ $y_{1},y_{2},\ldots,y_{M}$ $r_{1},r_{2},\ldots ,r_{N}$ $s_{1},s_{2},\ldots ,s_{M}$

T={\frac {NM}{N+M}}\omega ^{2}={\frac {U}{NM(N+M)}}-{\frac {4MN-1}{6(M+N)}}

donde U se define como

U=N\sum _{i=1}^{N}(r_{i}-i)^{2}+M\sum _{j=1}^{M}(s_{j}-j)^{2}

Si el valor de T es mayor que los valores tabulados, ^[3]^{: 1154–1159} se puede rechazar la hipótesis de que las dos muestras provienen de la misma distribución. (Algunos libros ^{[ especifican ]} dan valores críticos para U , lo cual es más conveniente, ya que evita la necesidad de calcular T mediante la expresión anterior. La conclusión será la misma.)

Lo anterior supone que no hay duplicados en las secuencias , y . Por lo tanto , es único y su rango es en la lista ordenada . Si hay duplicados, y a través de hay una serie de valores idénticos en la lista ordenada, entonces un enfoque común es el método midrank ^[7] : asignar a cada duplicado un "rango" de . En las ecuaciones anteriores, en las expresiones y , los duplicados pueden modificar las cuatro variables , , y . $x$ $y$ $r$ $x_{i}$ $i$ $x_{1},\ldots ,x_{N}$ $x_{i}$ $x_{j}$ $(i+j)/2$ $(r_{i}-i)^{2}$ $(s_{j}-j)^{2}$ $r_{i}$ $i$ $s_{j}$ $j$

Referencias

^ Cramér, H. (1928). "Sobre la composición de errores elementales". Scandinavian Actuarial Journal . 1928 (1): 13–74. doi :10.1080/03461238.1928.10416862.
^ von Mises, RE (1928). Wahrscheinlichkeit, Statistik und Wahrheit . Julio Springer.
^ abcd Anderson, TW (1962). "Sobre la distribución del criterio de Cramer-von Mises para dos muestras" (PDF) . Anales de estadística matemática . 33 (3). Instituto de estadística matemática : 1148–1159. doi : 10.1214/aoms/1177704477 . ISSN 0003-4851 . Consultado el 12 de junio de 2009 .
^ AN Kolmogorov, "Sulla determinizione empirica di una legge di distribuzione" Giorn. Ist. Italiano. Attuari, 4 (1933) págs. 83–91
^ ab Pearson, ES , Hartley, HO (1972) Biometrika Tables for Statisticians, Volumen 2 , CUP. ISBN 0-521-06937-8 (página 118 y Tabla 54)
^ Watson, GS (1961) "Pruebas de bondad de ajuste en un círculo", Biometrika , 48 (1/2), 109-114 JSTOR 2333135
^ Ruymgaart, FH, (1980) "Un enfoque unificado para la teoría de la distribución asintótica de ciertas estadísticas de rango medio". En: Statistique non Parametrique Asymptotique , 1±18, JP Raoult (Ed.), Lecture Notes on Mathematics, No. 821, Springer, Berlín.

MA Stephens (1986). "Pruebas basadas en estadísticas EDF". En D'Agostino, RB; Stephens, MA (eds.). Técnicas de bondad de ajuste . Nueva York: Marcel Dekker. ISBN 0-8247-7487-6.

Lectura adicional

Xiao, Y.; A. Gordon; A. Yakovlev (enero de 2007). "Un programa C++ para la prueba de dos muestras de Cramér-von Mises" (PDF) . Revista de software estadístico . 17 (8). doi : 10.18637/jss.v017.i08 . ISSN 1548-7660. OCLC 42456366. S2CID 54098783 . Consultado el 12 de junio de 2009 .