Gama media

En estadística , el rango medio o extremo medio es una medida de tendencia central de una muestra definida como la media aritmética de los valores máximo y mínimo del conjunto de datos : ^[1]

M={\frac {\max x+\min x}{2}}.

El rango medio está estrechamente relacionado con el rango , una medida de dispersión estadística definida como la diferencia entre los valores máximos y mínimos. Las dos medidas son complementarias en el sentido de que si se conocen el rango medio y el rango, se pueden encontrar los valores máximos y mínimos de la muestra.

El rango medio rara vez se utiliza en el análisis estadístico práctico, ya que carece de eficiencia como estimador para la mayoría de las distribuciones de interés, porque ignora todos los puntos intermedios y carece de robustez, ya que los valores atípicos lo cambian significativamente. De hecho, para muchas distribuciones es una de las estadísticas menos eficientes y menos robustas. Sin embargo, encuentra algún uso en casos especiales: es el estimador de máxima eficiencia para el centro de una distribución uniforme, los rangos medios recortados abordan la robustez y, como estimador L , es simple de entender y calcular.

Robustez

El rango medio es muy sensible a los valores atípicos e ignora todos los puntos de datos excepto dos. Por lo tanto, es una estadística muy poco robusta , con un punto de ruptura de 0, lo que significa que una sola observación puede cambiarla arbitrariamente. Además, está muy influenciada por los valores atípicos: aumentar el máximo de la muestra o disminuir el mínimo de la muestra en x cambia el rango medio en mientras que cambia la media de la muestra, que también tiene un punto de ruptura de 0, solo en Por lo tanto, es de poca utilidad en las estadísticas prácticas, a menos que ya se manejen los valores atípicos. ${\estilo de visualización x/2,}$ $x/n.$

Un rango medio recortado se conoce comomidsummary – elrango medio recortadoal nn% y (100−n)%, y es más robusto, ya que tiene unpunto de rupturadeln%. En el medio de estos se encuentra labisagra media, que es el midsummary del 25 %. Lamedianase puede interpretar como el rango medio completamente recortado (50 %); esto concuerda con la convención de que la mediana de un número par de puntos es la media de los dos puntos medios.

Estos rangos medios recortados también son de interés como estadísticas descriptivas o como estimadores L de ubicación central o asimetría : las diferencias de los resúmenes medios, como la bisagra media menos la mediana, brindan medidas de asimetría en diferentes puntos de la cola. ^[2]

Eficiencia

A pesar de sus inconvenientes, en algunos casos es útil: el rango medio es un estimador muy eficiente de μ, dada una muestra pequeña de una distribución suficientemente platicúrtica , pero es ineficiente para distribuciones mesocúrticas , como la normal.

Por ejemplo, para una distribución uniforme continua con un máximo y un mínimo desconocidos, el rango medio es el estimador insesgado de varianza mínima uniforme (UMVU) para la media. El máximo y el mínimo de la muestra, junto con el tamaño de la muestra, son una estadística suficiente para el máximo y el mínimo de la población; la distribución de otras muestras, condicionada a un máximo y un mínimo dados, es simplemente la distribución uniforme entre el máximo y el mínimo y, por lo tanto, no agrega información. Consulte el problema del tanque alemán para obtener más información. Por lo tanto, el rango medio, que es un estimador insesgado y suficiente de la media de la población, es de hecho el UMVU: el uso de la media de la muestra solo agrega ruido basado en la distribución no informativa de los puntos dentro de este rango.

Por el contrario, para la distribución normal, la media de la muestra es el estimador UMVU de la media. Por lo tanto, para las distribuciones platicúrticas, que a menudo se pueden considerar entre una distribución uniforme y una distribución normal, la informatividad de los puntos de muestra medios frente a los valores extremos varía de "igual" para la distribución normal a "no informativa" para la distribución uniforme, y para diferentes distribuciones, una u otra (o alguna combinación de ellas) puede ser más eficiente. Un análogo robusto es la trimeana , que promedia la bisagra media (rango medio recortado en un 25 %) y la mediana.

Pequeñas muestras

Para tamaños de muestra pequeños ( n de 4 a 20) extraídos de una distribución suficientemente platicúrtica ( curtosis excesiva negativa , definida como γ ₂ = (μ ₄ /(μ ₂ )²) − 3), el rango medio es un estimador eficiente de la media μ . La siguiente tabla resume datos empíricos que comparan tres estimadores de la media para distribuciones de curtosis variada; la media modificada es la media truncada , donde se eliminan el máximo y el mínimo. ^[3]^[4]

Para n = 1 o 2, el rango medio y la media son iguales (y coinciden con la mediana), y son más eficientes para todas las distribuciones. Para n = 3, la media modificada es la mediana, y en cambio la media es la medida de tendencia central más eficiente para valores de γ ₂ de 2,0 a 6,0, así como de −0,8 a 2,0.

Propiedades de muestreo

Para una muestra de tamaño n de la distribución normal estándar , el rango medio M es imparcial y tiene una varianza dada por: ^[5]

\operatorname {var} (M)={\frac {\pi ^{2}}{24\ln(n)}}.

Para una muestra de tamaño n de la distribución estándar de Laplace , el rango medio M es imparcial y tiene una varianza dada por: ^[6]

\operatorname {var} (M)={\frac {\pi ^{2}}{12}}

y, en particular, la varianza no disminuye a cero a medida que aumenta el tamaño de la muestra.

Para una muestra de tamaño n de una distribución uniforme centrada en cero , el rango medio M es imparcial, nM tiene una distribución asintótica que es una distribución de Laplace . ^[7]

Desviación

Mientras que la media de un conjunto de valores minimiza la suma de los cuadrados de las desviaciones y la mediana minimiza la desviación absoluta promedio , el rango medio minimiza la desviación máxima (definida como ): es una solución a un problema variacional . $\max \izquierda|x_{i}-m\derecha|$

Véase también

Referencias

^ Esquivar 2003.
^ Velleman y Hoaglin 1981.
^ Vinson, William Daniel (1951). Una investigación de las medidas de tendencia central utilizadas en el control de calidad (maestría). Universidad de Carolina del Norte en Chapel Hill. Tabla (4.1), págs. 32–34.
^ Cowden, Dudley Johnstone (1957). Métodos estadísticos en el control de calidad . Prentice-Hall. págs. 67–68.
^ Kendall y Stuart 1969, Ejemplo 14.4.
^ Kendall y Stuart 1969, Ejemplo 14.5.
^ Kendall y Stuart 1969, Ejemplo 14.12.

Dodge, Y. (2003). Diccionario Oxford de términos estadísticos . Oxford University Press. ISBN 0-19-920613-9.
Kendall, MG; Stuart, A. (1969). La teoría avanzada de las estadísticas, volumen 1. Griffin. ISBN 0-85264-141-9.
Velleman, PF; Hoaglin, DC (1981). Aplicaciones, fundamentos y cálculo del análisis exploratorio de datos . Duxbury Press. ISBN 0-87150-409-X.