estimador L

Los estimadores L simples se pueden estimar visualmente a partir de un diagrama de caja e incluyen rango intercuartil , bisagra media , rango , rango medio y trimean .

En estadística , un estimador L es un estimador que es una combinación lineal de estadísticas de orden de las mediciones (también llamado estadístico L ). Esto puede ser tan solo un punto, como en la mediana (de un número impar de valores), o tantos como todos los puntos, como en la media.

Los principales beneficios de los estimadores L son que a menudo son estadísticas extremadamente simples y, a menudo, sólidas : suponiendo datos ordenados, son muy fáciles de calcular e interpretar y, a menudo, son resistentes a los valores atípicos. Por lo tanto, son útiles en estadísticas sólidas, como estadísticas descriptivas , en educación estadística y cuando el cálculo es difícil. Sin embargo, son ineficientes y en los tiempos modernos se prefieren los estimadores M estadísticos robustos , aunque son mucho más difíciles computacionalmente. En muchas circunstancias, los estimadores L son razonablemente eficientes y, por tanto, adecuados para la estimación inicial.

Ejemplos

Un ejemplo básico es la mediana . Dados n valores , si es impar, la mediana es igual al estadístico de -ésimo orden; si es par, es el promedio de dos estadísticas de orden: . Ambas son combinaciones lineales de estadísticos de orden y, por lo tanto, la mediana es un ejemplo simple de estimador L. $x_{1},\ldots,x_{n}$ $n=2k+1$ $x_{(k+1)}$ $(n+1)/2$ $n=2k$ $(x_{(k)}+x_{(k+1)})/2$

Una lista más detallada de ejemplos incluye: con un solo punto, el máximo, el mínimo o cualquier estadística o cuantil de un solo orden ; con uno o dos puntos, la mediana; con dos puntos, el rango medio , el rango , el resumen medio ( rango medio recortado , incluida la bisagra media ) y el rango recortado (incluido el rango intercuartil y el rango interdecil ); con tres puntos, la trimesa ; con una fracción fija de los puntos, la media recortada (incluida la media intercuartil ) y la media winsorizada ; con todos los puntos, la media.

Tenga en cuenta que algunas de ellas (como la mediana o el rango medio) son medidas de tendencia central y se utilizan como estimadores de un parámetro de ubicación , como la media de una distribución normal, mientras que otras (como el rango o el rango recortado) Son medidas de dispersión estadística y se utilizan como estimadores de un parámetro de escala , como la desviación estándar de una distribución normal.

Los estimadores L también pueden medir la forma de una distribución, más allá de la ubicación y la escala. Por ejemplo, la bisagra media menos la mediana es un estimador L de 3 términos que mide la asimetría , y otras diferencias de los resúmenes intermedios dan medidas de asimetría en diferentes puntos de la cola. ^[1]

Los momentos L de muestra son estimadores L para el momento L de la población y tienen expresiones bastante complejas. Los momentos L generalmente se tratan por separado; consulte ese artículo para obtener más detalles.

Robustez

Los estimadores L suelen ser estadísticamente resistentes y tienen un punto de ruptura alto . Esto se define como la fracción de las mediciones que pueden cambiarse arbitrariamente sin causar que la estimación resultante tienda al infinito (es decir, que se "descomponga"). El punto de desglose de un estimador L viene dado por el estadístico de orden más cercano al mínimo o al máximo: por ejemplo, la mediana tiene un punto de desglose del 50 % (el más alto posible) y una media winsorizada o recortada de n % tiene un desglose punto de n %.

No todos los estimadores L son robustos; si incluye el mínimo o el máximo, entonces tiene un punto de ruptura de 0. Estos estimadores L no robustos incluyen el rango mínimo, máximo, medio y medio. Sin embargo, los equivalentes recortados son robustos.

Los estimadores L robustos utilizados para medir la dispersión, como el IQR, proporcionan medidas sólidas de escala .

Aplicaciones

En el uso práctico en estadísticas sólidas , los estimadores L han sido reemplazados por estimadores M , que proporcionan estadísticas sólidas que también tienen una alta eficiencia relativa , a costa de ser mucho más complejos y opacos desde el punto de vista computacional.

Sin embargo, la simplicidad de los estimadores L significa que se interpretan y visualizan fácilmente, y los hace adecuados para la estadística descriptiva y la educación estadística ; muchos incluso pueden calcularse mentalmente a partir de un resumen de cinco números o de siete números , o visualizarse a partir de un diagrama de caja . Los estimadores L juegan un papel fundamental en muchos enfoques de la estadística no paramétrica .

Aunque no son paramétricos, los estimadores L se utilizan con frecuencia para la estimación de parámetros , como lo indica su nombre, aunque a menudo deben ajustarse para producir un estimador consistente e insesgado . La elección del estimador L y el ajuste dependen de la distribución cuyo parámetro se estima.

Por ejemplo, al estimar un parámetro de ubicación , para una distribución simétrica, un estimador L simétrico (como la mediana o la bisagra media) será insesgado. Sin embargo, si la distribución tiene asimetría , los estimadores L simétricos generalmente estarán sesgados y requerirán ajuste. Por ejemplo, en una distribución asimétrica, la asimetría no paramétrica (y los coeficientes de asimetría de Pearson ) miden el sesgo de la mediana como estimador de la media.

Al estimar un parámetro de escala , como cuando se utiliza un estimador L como medida robusta de escala , como para estimar la varianza poblacional o la desviación estándar de la población , generalmente se debe multiplicar por un factor de escala para convertirlo en un estimador consistente e insesgado; ver parámetro de escala: estimación .

Por ejemplo, dividir el IQR por (usando la función de error ) lo convierte en un estimador insesgado y consistente de la desviación estándar de la población si los datos siguen una distribución normal . $2{\sqrt {2}}\operatorname {erf} ^{-1}(1/2)\aproximadamente 1,349$

Los estimadores L también se pueden utilizar como estadísticas por derecho propio; por ejemplo, la mediana es una medida de ubicación y el IQR es una medida de dispersión. En estos casos, las estadísticas muestrales pueden actuar como estimadores de su propio valor esperado ; por ejemplo, la mediana muestral es un estimador de la mediana poblacional.

Ventajas

Más allá de la simplicidad, los estimadores L también suelen ser fáciles de calcular y robustos.

Suponiendo datos ordenados, los estimadores L que involucran sólo unos pocos puntos se pueden calcular con muchas menos operaciones matemáticas que las estimaciones eficientes. ^[2]^[3] Antes de la llegada de las calculadoras electrónicas y las computadoras , éstas proporcionaban una forma útil de extraer gran parte de la información de una muestra con un mínimo de trabajo. Estos se mantuvieron en uso práctico durante principios y mediados del siglo XX, cuando era posible la clasificación automatizada de datos de tarjetas perforadas , pero el cálculo seguía siendo difícil ^[2] y todavía se utilizan hoy en día, para estimaciones dadas una lista de valores numéricos en métodos no mecánicos. -formato legible , donde la entrada de datos es más costosa que la clasificación manual. También permiten una estimación rápida.

Los estimadores L son a menudo mucho más robustos que los métodos convencionales de máxima eficiencia: la mediana es estadísticamente resistente al máximo y tiene un punto de ruptura del 50% , y el rango medio recortado en X% tiene un punto de ruptura del X%, mientras que la media muestral (que es máximamente eficiente) es mínimamente robusto y se descompone en un solo valor atípico.

Eficiencia

Si bien los estimadores L no son tan eficientes como otras estadísticas, a menudo tienen una eficiencia relativa razonablemente alta y muestran que una gran fracción de la información utilizada en la estimación se puede obtener utilizando sólo unos pocos puntos (tan solo uno, dos o tres). . Alternativamente, muestran que las estadísticas de pedidos contienen una cantidad significativa de información.

Por ejemplo, en términos de eficiencia, dada una muestra de un parámetro numérico normalmente distribuido , la media aritmética (promedio) de la población se puede estimar con la máxima eficiencia calculando la media muestral : sumando todos los miembros de la muestra y dividiéndola por el número de miembros.

Sin embargo, para un conjunto de datos grande (más de 100 puntos) de una población simétrica, la media se puede estimar de manera razonablemente eficiente en relación con la mejor estimación mediante estimadores L. Usando un solo punto, esto se hace tomando la mediana de la muestra, sin necesidad de cálculos (aparte de ordenar); esto produce una eficiencia del 64% o mejor (para todos n ). Usando dos puntos, una estimación simple es la bisagra media (el rango medio recortado al 25% ), pero una estimación más eficiente es el rango medio recortado al 29%, es decir, promediando los dos valores al 29% del camino desde el más pequeño. y los valores más grandes: los percentiles 29 y 71; esto tiene una eficiencia de aproximadamente el 81%. ^[3] Para tres puntos, se puede utilizar el trimean (promedio de la mediana y la bisagra media), aunque el promedio de los percentiles 20, 50 y 80 arroja una eficiencia del 88%. El uso de más puntos produce una mayor eficiencia, aunque es notable que solo se necesitan 3 puntos para una eficiencia muy alta.

Para estimar la desviación estándar de una distribución normal, el rango interdecil escalado proporciona un estimador razonablemente eficiente, aunque en su lugar se toma el rango recortado del 7% (la diferencia entre los percentiles 7 y 93) y se divide por 3 (correspondiente al 86% de los datos). de una distribución normal que cae dentro de 1,5 desviaciones estándar de la media) produce una estimación de alrededor del 65% de eficiencia. ^[3]

Para muestras pequeñas, los estimadores L también son relativamente eficientes: el resumen medio del tercer punto de cada extremo tiene una eficiencia de alrededor del 84% para muestras de tamaño aproximado a 10, y el rango dividido por tiene una eficiencia razonablemente buena para tamaños de hasta 20, aunque esto cae al aumentar n y el factor de escala se puede mejorar (eficiencia 85% por 10 puntos). Otros estimadores heurísticos para muestras pequeñas incluyen el rango sobre n (para el error estándar) y el rango al cuadrado sobre la mediana (para la chi-cuadrado de una distribución de Poisson). ^[3] ${\sqrt {n}}$

Ver también

Referencias

^ Velleman y Hoaglin 1981.
^ ab Mosteller 2006.
^ abcd Evans 1955, Apéndice G: Estadísticas ineficientes, págs.

Evans, Robley Dunglison (1955). El núcleo atómico. Serie internacional de física pura y aplicada. McGraw-Hill. págs.972. ISBN 0-89874414-8.
Fraiman, R.; Meloche, J.; García-Escudero, LA; Gordaliza, A.; Él, X .; Marona, R.; Yohai, VCJ; Funda, SJ; McKean, JW; Pequeño, CG; Madera, A.; Fraiman, R.; Meloche, J. (1999). "Estimación L multivariada". Prueba . 8 (2): 255–317. doi :10.1007/BF02595872.
Huber, Peter J. (2004). Estadísticas sólidas . Nueva York: Wiley-Interscience. ISBN 0-471-65072-2.
Mosteller, Federico (2006) [1946]. "Sobre algunas estadísticas" ineficientes "útiles". En Fienberg, Stephen; Hoaglin, David (eds.). Artículos seleccionados de Frederick Mosteller . Serie Springer en Estadística. Nueva York: Springer. págs. 69-100. doi :10.1007/978-0-387-44956-2_4. ISBN 978-0-387-20271-6.
Shao, junio (2003). Estadística matemática . Berlín: Springer-Verlag. ISBN 0-387-95382-5.– seg. 5.2.2
Velleman, PF; Hoaglin, DC (1981). Aplicaciones, conceptos básicos y computación del análisis de datos exploratorios . ISBN 0-87150-409-X.