stringtranslate.com

Rango (estadísticas)

En estadística , el rango de un conjunto de datos es la diferencia entre el valor mayor y el menor, [1] el resultado de restar el máximo y el mínimo muestral . Se expresa en las mismas unidades que los datos.

En estadística descriptiva , el rango es el tamaño del intervalo más pequeño que contiene todos los datos y proporciona una indicación de la dispersión estadística . Dado que sólo depende de dos de las observaciones, es más útil para representar la dispersión de pequeños conjuntos de datos. [2]

Para variables aleatorias IID continuas

Para n variables aleatorias continuas independientes e idénticamente distribuidas X 1 , X 2 , ..., X n con la función de distribución acumulativa G( x ) y una función de densidad de probabilidad g( x ), sea T el rango de ellas, es decir , T= máx( X 1 , X 2 , ..., X n )- mín( X 1 , X 2 , ..., X n ).

Distribución

El rango, T, tiene la función de distribución acumulativa [3] [4]

Gumbel señala que "la belleza de esta fórmula queda completamente empañada por el hecho de que, en general, no podemos expresar G ( x  +  t ) por G ( x ), y que la integración numérica es larga y tediosa". [3] : 385 

Si la distribución de cada X i se limita a la derecha (o izquierda), entonces la distribución asintótica del rango es igual a la distribución asintótica del valor más grande (más pequeño). Para distribuciones más generales, la distribución asintótica se puede expresar como una función de Bessel . [3]

Momentos

El rango medio viene dado por [5]

donde x ( G ) es la función inversa. En el caso de que cada uno de los X i tenga una distribución normal estándar , el rango medio viene dado por [6]

Para variables aleatorias continuas no IID

Para n variables aleatorias continuas independientes distribuidas no idénticamente X 1 , X 2 , ..., X n con funciones de distribución acumulativa G 1 ( x ), G 2 ( x ), ..., G n ( x ) y funciones de densidad de probabilidad g 1 ( x ), g 2 ( x ), ..., g n ( x ), el rango tiene una función de distribución acumulativa [4]

Para variables aleatorias IID discretas

Para n variables aleatorias discretas independientes e idénticamente distribuidas X 1 , X 2 , ..., X n con función de distribución acumulativa G ( x ) y función de masa de probabilidad g ( x ) el rango de X i es el rango de una muestra de tamaño n de una población con función de distribución G ( x ). Podemos suponer sin pérdida de generalidad que el soporte de cada X i es {1,2,3,..., N } donde N es un número entero positivo o infinito. [7] [8]

Distribución

El rango tiene función de masa de probabilidad [7] [9] [10]

Ejemplo

Si suponemos que g ( x ) = 1/ N , la distribución uniforme discreta para todo x , entonces encontramos [9] [11]

Derivación

La probabilidad de tener un valor de rango específico, t , se puede determinar sumando las probabilidades de tener dos muestras que difieran en t , y cada dos muestras que tengan un valor entre los dos extremos. La probabilidad de que una muestra tenga un valor de x es . La probabilidad de que otro tenga un valor t mayor que x es:

La probabilidad de que todos los demás valores se encuentren entre estos dos extremos es:

Combinando los tres se obtiene:

Cantidades relacionadas

El rango es un ejemplo específico de estadísticas de pedidos . En particular, el rango es una función lineal de las estadísticas de orden, lo que lo coloca en el alcance de la estimación L.

Ver también

Referencias

  1. ^ George Woodbury (2001). Introducción a la estadística . Aprendizaje Cengage. pag. 74.ISBN _ 0534377556.
  2. ^ Carin Viljoen (2000). Estadística elemental: volumen 2 . Pearson Sudáfrica. págs. 7–27. ISBN 186891075X.
  3. ^ a b C EJ Gumbel (1947). "La distribución del rango". Los anales de la estadística matemática . 18 (3): 384–412. doi : 10.1214/aoms/1177730387 . JSTOR  2235736.
  4. ^ ab Tsimashenka, I.; Knottenbelt, W.; Harrison, P. (2012). "Control de la variabilidad en sistemas divididos y fusionados". Técnicas y aplicaciones de modelado analítico y estocástico (PDF) . Apuntes de conferencias sobre informática. vol. 7314. pág. 165. doi :10.1007/978-3-642-30782-9_12. ISBN 978-3-642-30781-2.
  5. ^ HO Hartley ; HA David (1954). "Límites universales para alcance medio y observación extrema". Los anales de la estadística matemática . 25 (1): 85–99. doi : 10.1214/aoms/1177728848 . JSTOR  2236514.
  6. ^ LHC Tippett (1925). "Sobre los individuos extremos y la gama de muestras tomadas de una población normal". Biometrika . 17 (3/4): 364–387. doi :10.1093/biomet/17.3-4.364. JSTOR  2332087.
  7. ^ ab Evans, DL; Leemis, LM; Dibujó, JH (2006). "La distribución de estadísticas de pedidos para variables aleatorias discretas con aplicaciones de bootstrapping". Revista INFORMA de Informática . 18 : 19. doi : 10.1287/ijoc.1040.0105.
  8. ^ Irving W. Burr (1955). "Cálculo de la distribución muestral exacta de rangos de una población discreta". Los anales de la estadística matemática . 26 (3): 530–532. doi : 10.1214/aoms/1177728500 . JSTOR  2236482.
  9. ^ ab Abdel-Aty, SH (1954). "Variables ordenadas en distribuciones discontinuas". Statistica Neerlandica . 8 (2): 61–82. doi :10.1111/j.1467-9574.1954.tb00442.x.
  10. ^ Siotani, M. (1956). "Estadísticas de orden para caso discreto con aplicación numérica a la distribución binomial". Anales del Instituto de Matemática Estadística . 8 : 95–96. doi :10.1007/BF02863574.
  11. ^ Paul R. Jinete (1951). "La distribución del rango en muestras de una población rectangular discreta". Revista de la Asociación Estadounidense de Estadística . 46 (255): 375–378. doi :10.1080/01621459.1951.10500796. JSTOR  2280515.