Concepto en estadística
En estadística , el rango de un conjunto de datos es la diferencia entre el valor mayor y el menor, [1]
el resultado de restar el máximo y el mínimo muestral . Se expresa en las mismas unidades que los datos.
En estadística descriptiva , el rango es el tamaño del intervalo más pequeño que contiene todos los datos y proporciona una indicación de la dispersión estadística . Dado que sólo depende de dos de las observaciones, es más útil para representar la dispersión de pequeños conjuntos de datos. [2]
Para variables aleatorias IID continuas
Para n variables aleatorias continuas independientes e idénticamente distribuidas X 1 , X 2 , ..., X n con la función de distribución acumulativa G( x ) y una función de densidad de probabilidad g( x ), sea T el rango de ellas, es decir , T= máx( X 1 , X 2 , ..., X n )- mín( X 1 , X 2 , ..., X n ).
Distribución
El rango, T, tiene la función de distribución acumulativa [3] [4]
![{\displaystyle F(t)=n\int _{-\infty }^{\infty }g(x)[G(x+t)-G(x)]^{n-1}\,{\text {d}}x.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Gumbel señala que "la belleza de esta fórmula queda completamente empañada por el hecho de que, en general, no podemos expresar G ( x + t ) por G ( x ), y que la integración numérica es larga y tediosa". [3] : 385
Si la distribución de cada X i se limita a la derecha (o izquierda), entonces la distribución asintótica del rango es igual a la distribución asintótica del valor más grande (más pequeño). Para distribuciones más generales, la distribución asintótica se puede expresar como una función de Bessel . [3]
Momentos
El rango medio viene dado por [5]
![{\displaystyle n\int _{0}^{1}x(G)[G^{n-1}-(1-G)^{n-1}]\,{\text{d}}G}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
donde x ( G ) es la función inversa. En el caso de que cada uno de los X i tenga una distribución normal estándar , el rango medio viene dado por [6]
![{\displaystyle \int _{-\infty }^{\infty }(1-(1-\Phi (x))^{n}-\Phi (x)^{n})\,{\text{d }}X.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Para variables aleatorias continuas no IID
Para n variables aleatorias continuas independientes distribuidas no idénticamente X 1 , X 2 , ..., X n con funciones de distribución acumulativa G 1 ( x ), G 2 ( x ), ..., G n ( x ) y funciones de densidad de probabilidad g 1 ( x ), g 2 ( x ), ..., g n ( x ), el rango tiene una función de distribución acumulativa [4]
![{\displaystyle F(t)=\sum _{i=1}^{n}\int _{-\infty }^{\infty }g_{i}(x)\prod _{j=1,j\ neq i}^{n}[G_{j}(x+t)-G_{j}(x)]\,{\text{d}}x.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Para variables aleatorias IID discretas
Para n variables aleatorias discretas independientes e idénticamente distribuidas X 1 , X 2 , ..., X n con función de distribución acumulativa G ( x ) y función de masa de probabilidad g ( x ) el rango de X i es el rango de una muestra de tamaño n de una población con función de distribución G ( x ). Podemos suponer sin pérdida de generalidad que el soporte de cada X i es {1,2,3,..., N } donde N es un número entero positivo o infinito. [7] [8]
Distribución
El rango tiene función de masa de probabilidad [7] [9] [10]
![{\displaystyle f(t)={\begin{casos}\sum _{x=1}^{N}[g(x)]^{n}&t=0\\[6pt]\sum _{x= 1}^{Nt}\left({\begin{alignedat}{2}&[G(x+t)-G(x-1)]^{n}\\{}-{}&[G(x +t)-G(x)]^{n}\\{}-{}&[G(x+t-1)-G(x-1)]^{n}\\{}+{}& [G(x+t-1)-G(x)]^{n}\\\end{alignedat}}\right)&t=1,2,3\ldots ,N-1.\end{cases}} }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Ejemplo
Si suponemos que g ( x ) = 1/ N , la distribución uniforme discreta para todo x , entonces encontramos [9] [11]
![{\displaystyle f(t)={\begin{casos}{\frac {1}{N^{n-1}}}&t=0\\[4pt]\sum _{x=1}^{Nt} \left(\left[{\frac {t+1}{N}}\right]^{n}-2\left[{\frac {t}{N}}\right]^{n}+\left [{\frac {t-1}{N}}\right]^{n}\right)&t=1,2,3\ldots ,N-1.\end{casos}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Derivación
La probabilidad de tener un valor de rango específico, t , se puede determinar sumando las probabilidades de tener dos muestras que difieran en t , y cada dos muestras que tengan un valor entre los dos extremos. La probabilidad de que una muestra tenga un valor de x es . La probabilidad de que otro tenga un valor t mayor que x es:![{\displaystyle ng(x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle (n-1)g(x+t).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La probabilidad de que todos los demás valores se encuentren entre estos dos extremos es:
![{\displaystyle \left(\int _{x}^{x+t}g(x)\,{\text{d}}x\right)^{n-2}=\left(G(x+t )-G(x)\derecha)^{n-2}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Combinando los tres se obtiene:
![{\displaystyle f(t)=n(n-1)\int _{-\infty }^{\infty }g(x)g(x+t)[G(x+t)-G(x)] ^{n-2}\,{\text{d}}x}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Cantidades relacionadas
El rango es un ejemplo específico de estadísticas de pedidos . En particular, el rango es una función lineal de las estadísticas de orden, lo que lo coloca en el alcance de la estimación L.
Ver también
Referencias
- ^ George Woodbury (2001). Introducción a la estadística . Aprendizaje Cengage. pag. 74.ISBN _ 0534377556.
- ^ Carin Viljoen (2000). Estadística elemental: volumen 2 . Pearson Sudáfrica. págs. 7–27. ISBN 186891075X.
- ^ a b C EJ Gumbel (1947). "La distribución del rango". Los anales de la estadística matemática . 18 (3): 384–412. doi : 10.1214/aoms/1177730387 . JSTOR 2235736.
- ^ ab Tsimashenka, I.; Knottenbelt, W.; Harrison, P. (2012). "Control de la variabilidad en sistemas divididos y fusionados". Técnicas y aplicaciones de modelado analítico y estocástico (PDF) . Apuntes de conferencias sobre informática. vol. 7314. pág. 165. doi :10.1007/978-3-642-30782-9_12. ISBN 978-3-642-30781-2.
- ^ HO Hartley ; HA David (1954). "Límites universales para alcance medio y observación extrema". Los anales de la estadística matemática . 25 (1): 85–99. doi : 10.1214/aoms/1177728848 . JSTOR 2236514.
- ^ LHC Tippett (1925). "Sobre los individuos extremos y la gama de muestras tomadas de una población normal". Biometrika . 17 (3/4): 364–387. doi :10.1093/biomet/17.3-4.364. JSTOR 2332087.
- ^ ab Evans, DL; Leemis, LM; Dibujó, JH (2006). "La distribución de estadísticas de pedidos para variables aleatorias discretas con aplicaciones de bootstrapping". Revista INFORMA de Informática . 18 : 19. doi : 10.1287/ijoc.1040.0105.
- ^ Irving W. Burr (1955). "Cálculo de la distribución muestral exacta de rangos de una población discreta". Los anales de la estadística matemática . 26 (3): 530–532. doi : 10.1214/aoms/1177728500 . JSTOR 2236482.
- ^ ab Abdel-Aty, SH (1954). "Variables ordenadas en distribuciones discontinuas". Statistica Neerlandica . 8 (2): 61–82. doi :10.1111/j.1467-9574.1954.tb00442.x.
- ^ Siotani, M. (1956). "Estadísticas de orden para caso discreto con aplicación numérica a la distribución binomial". Anales del Instituto de Matemática Estadística . 8 : 95–96. doi :10.1007/BF02863574.
- ^ Paul R. Jinete (1951). "La distribución del rango en muestras de una población rectangular discreta". Revista de la Asociación Estadounidense de Estadística . 46 (255): 375–378. doi :10.1080/01621459.1951.10500796. JSTOR 2280515.