Estadísticos de orden

Por ejemplo, supongamos que se observan o son registrados 4 números, lo que resulta en una muestra de tamaño 4.

Si los valores de la muestra son 6, 9, 3, 8, que por lo general se denominan donde el subíndice i in

simplemente indica el orden en el que se registraron las observaciones y se supone por lo general no son significativos.

Los estadísticas de orden se indican donde el subíndice (i) entre paréntesis indica el orden º del estadística de la muestra i.

El primer estadístico de orden (o estadístico de orden más pequeño) es siempre el mínimo de la muestra, es decir, donde, tras una convención común, se utilizan letras mayúsculas para hacer referencia a variables aleatorias, y las letras minúsculas (como arriba) para los valores reales observados.

Del mismo modo, para una muestra de tamaño n, el n-ésimo estadístico de orden n (o más grande estadístico de orden) es el máximo, es decir: El rango de la muestra es la diferencia entre el máximo y el mínimo.

La mediana de la muestra puede ser o puede no ser un estadístico, ya que hay un único elemento medio sólo cuando el número n de observaciones es impar .

Más precisamente, si n = 2m+1 para algunos m, entonces la mediana de la muestra es

y así es un estadístico de orden.

, y la mediana de la muestra es una función de los dos (por lo general el promedio) y por lo tanto no es un estadística orden.

Observaciones similares valen para todos los cuantiles de la muestra.

Teniendo en cuenta todas las variables aleatorias X1, X2..., Xn, los estadísticas de orden X(1), X(2), ..., X(n) también son variables aleatorias, definidas por la clasificación de los valores ( Realizaciones ) de X1, ..., Xn creciente.

Cuando las variables aleatorias X1, X2..., Xn forman una muestra de que son independientes e idénticamente distribuidos.

Este es el caso tratado a continuación.

Entonces ellos son independientes , pero no necesariamente idénticamente distribuidas, y su distribución de probabilidad conjunta está dada por el teorema Bapat-Beg.

A partir de ahora, asumiremos que las variables aleatorias que se consideran son continuos y, cuando sea conveniente, también vamos a asumir que tienen una función de densidad de probabilidad (es decir, que son absolutamente continua).

También damos un método sencillo para derivar la distribución conjunta de cualquier número de estadísticas de orden y, finalmente, traducir estos resultados para distribuciones continuas arbitrarias utilizando el CDF .

Suponemos que toda esta sección

es una muestra aleatoria extraída de una distribución continua con cdf

Tenga en cuenta que las estadísticas de orden también satisfacen

e igual a:[2]​ es decir, el k-ésimo orden estadística de la distribución uniforme es una Beta variable aleatoria.

[2]​[3]​ La prueba de estos estados es el siguiente.

La probabilidad de que más de uno es en este último intervalo es ya O (du ^ 2) , Así que tenemos que calcular la probabilidad de que exactamente k - 1, 1 y n - k observaciones caen en los intervalos

Esto es igual a (consulte la distribución multinomial para más detalles)

La media de esta distribución es k / (n + 1).

que es (hasta términos de orden superior

Una manera de entender esto es que la muestra no ordenada tiene densidad constante igual a 1, y que hay n!

Esto está relacionado con el hecho de que 1 / n!

[4]​ Si una variable posee una distribución absolutamente continua FX, entonces admite una densidad de probabilidad tal que

, y en las fórmulas anteriores pueden practicarse las substituciones: