stringtranslate.com

Rango medio

En estadística , el rango medio o extremo medio es una medida de tendencia central de una muestra definida como la media aritmética de los valores máximo y mínimo del conjunto de datos : [1]

El rango medio está estrechamente relacionado con el rango , una medida de dispersión estadística definida como la diferencia entre los valores máximo y mínimo. Las dos medidas son complementarias en el sentido de que si se conocen el rango medio y el rango, se pueden encontrar los valores máximo y mínimo de la muestra.

El rango medio rara vez se utiliza en el análisis estadístico práctico, ya que carece de eficiencia como estimador para la mayoría de las distribuciones de interés, porque ignora todos los puntos intermedios y carece de solidez, ya que los valores atípicos lo cambian significativamente. De hecho, para muchas distribuciones es una de las estadísticas menos eficientes y menos sólidas. Sin embargo, encuentra algún uso en casos especiales: es el estimador de máxima eficiencia para el centro de una distribución uniforme, los rangos medios recortados abordan la robustez y, como estimador L , es fácil de entender y calcular.

Robustez

El rango medio es muy sensible a los valores atípicos e ignora todos los puntos de datos excepto dos. Por lo tanto, es una estadística muy poco robusta , ya que tiene un punto de ruptura de 0, lo que significa que una sola observación puede cambiarla arbitrariamente. Además, está muy influenciado por valores atípicos: aumentar el máximo de la muestra o disminuir el mínimo de la muestra en x cambia el rango medio en mientras que cambia la media de la muestra, que también tiene un punto de ruptura de 0, en solo. Por lo tanto, es de poca utilidad en estadísticas prácticas, a menos que ya se manejen los valores atípicos.

Un rango medio recortado se conoce comoresumen intermedio : elde n% es el promedio de losn% y (100 −n) %, y es más sólido, ya que tiene unpunto de rupturaden%. En medio de estos está labisagra media, que es el resumen medio del 25%. Lamedianapuede interpretarse como el rango medio totalmente recortado (50%); esto concuerda con la convención de que la mediana de un número par de puntos es la media de los dos puntos medios.

Estos rangos medios recortados también son de interés como estadísticas descriptivas o como estimadores L de ubicación central o asimetría : las diferencias de resúmenes medios, como la bisagra media menos la mediana, dan medidas de asimetría en diferentes puntos de la cola. [2]

Eficiencia

A pesar de sus inconvenientes, en algunos casos es útil: el rango medio es un estimador muy eficiente de μ, dada una pequeña muestra de una distribución suficientemente platicúrtica , pero es ineficiente para distribuciones mesocúrticas , como la normal.

Por ejemplo, para una distribución uniforme continua con máximo y mínimo desconocidos, el rango medio es el estimador insesgado de varianza mínima uniforme (UMVU) para la media. El máximo y el mínimo de la muestra, junto con el tamaño de la muestra, son estadísticas suficientes para el máximo y el mínimo de la población; la distribución de otras muestras, condicionada a un máximo y un mínimo dados, es simplemente la distribución uniforme entre el máximo y el mínimo y, por lo tanto, suman sin información. Consulte el problema de los tanques alemanes para obtener más información. Por lo tanto, el rango medio, que es un estimador insesgado y suficiente de la media poblacional, es de hecho el UMVU: usar la media muestral solo agrega ruido basado en la distribución poco informativa de los puntos dentro de este rango.

Por el contrario, para la distribución normal, la media muestral es el estimador UMVU de la media. Por lo tanto, para las distribuciones platicúrticas, que a menudo se pueden considerar entre una distribución uniforme y una distribución normal, la informatividad de los puntos muestrales medios versus los valores extremos varía de "igual" para las normales a "poco informativa" para las distribuciones uniformes y diferentes. , uno u otro (o alguna combinación de ellos) puede ser más eficiente. Un análogo robusto es el trimean , que promedia la bisagra media (25 % del rango medio recortado) y la mediana.

Pequeñas muestras

Para tamaños de muestra pequeños ( n de 4 a 20) extraídos de una distribución suficientemente platicúrtica ( curtosis excesiva negativa , definida como γ 2 = (μ 4 /(μ 2 )²) − 3), el rango medio es un estimador eficiente de la media μ . La siguiente tabla resume los datos empíricos que comparan tres estimadores de la media para distribuciones de curtosis variada; la media modificada es la media truncada , donde se eliminan el máximo y el mínimo. [3] [4]

Para n = 1 o 2, el rango medio y la media son iguales (y coinciden con la mediana) y son más eficientes para todas las distribuciones. Para n = 3, la media modificada es la mediana y, en cambio, la media es la medida de tendencia central más eficiente para valores de γ 2 de 2,0 a 6,0 así como de −0,8 a 2,0.

Propiedades de muestreo

Para una muestra de tamaño n de la distribución normal estándar , el rango medio M es insesgado y tiene una varianza dada por: [5]

Para una muestra de tamaño n de la distribución estándar de Laplace , el rango medio M es insesgado y tiene una varianza dada por: [6]

y, en particular, la varianza no disminuye a cero a medida que crece el tamaño de la muestra.

Para una muestra de tamaño n de una distribución uniforme centrada en cero , el rango medio M es insesgado, nM tiene una distribución asintótica que es una distribución de Laplace . [7]

Desviación

Mientras que la media de un conjunto de valores minimiza la suma de los cuadrados de las desviaciones y la mediana minimiza la desviación absoluta promedio , el rango medio minimiza la desviación máxima (definida como ): es una solución a un problema variacional .

Ver también

Referencias

  1. ^ Esquivar 2003.
  2. ^ Velleman y Hoaglin 1981.
  3. ^ Vinson, William Daniel (1951). Una investigación de medidas de tendencia central utilizadas en el control de calidad (Maestría). Universidad de Carolina del Norte en Chapel Hill. Cuadro (4.1), págs. 32-34.
  4. ^ Cowden, Dudley Johnstone (1957). Métodos estadísticos en control de calidad . Prentice Hall. págs. 67–68.
  5. ^ Kendall y Stuart 1969, ejemplo 14.4.
  6. ^ Kendall y Stuart 1969, ejemplo 14.5.
  7. ^ Kendall y Stuart 1969, ejemplo 14.12.