Estimador L

Los estimadores L simples se pueden estimar visualmente a partir de un diagrama de caja e incluyen rango intercuartil , bisagra media , rango , rango medio y trimeano .

En estadística , un estimador L (o estadístico L ) es un estimador que es una combinación lineal de los estadísticos de orden de las mediciones. Puede ser tan solo un punto, como en la mediana (de un número impar de valores), o tantos como todos los puntos, como en la media.

Los principales beneficios de los estimadores L son que a menudo son extremadamente simples y, a menudo, estadísticas robustas : suponiendo que los datos están ordenados, son muy fáciles de calcular e interpretar y, a menudo, son resistentes a los valores atípicos. Por lo tanto, son útiles en estadísticas robustas, como las estadísticas descriptivas , en la enseñanza de la estadística y cuando el cálculo es difícil. Sin embargo, son ineficientes y, en los tiempos modernos , se prefieren los estimadores M de estadística robusta , aunque estos son mucho más difíciles computacionalmente. En muchas circunstancias, los estimadores L son razonablemente eficientes y, por lo tanto, adecuados para la estimación inicial.

Ejemplos

Un ejemplo básico es la mediana . Dados n valores , si es impar, la mediana es igual a , el estadístico de orden -ésimo; si es par, es el promedio de dos estadísticos de orden: . Ambas son combinaciones lineales de estadísticos de orden y, por lo tanto, la mediana es un ejemplo simple de un estimador L. $x_{1},\ldots ,x_{n}$ ${\estilo de visualización n=2k+1}$ $estilo de visualización x_{(k+1)}}$ ${\estilo de visualización (n+1)/2}$ ${\estilo de visualización n=2k}$ $(x_{(k)}+x_{(k+1)})/2$

Una lista más detallada de ejemplos incluye: con un solo punto, el máximo, el mínimo o cualquier estadística de orden único o cuartil ; con uno o dos puntos, la mediana; con dos puntos, el rango medio , el rango , el resumen medio ( rango medio recortado , incluida la bisagra media ) y el rango recortado (incluidos el rango intercuartil y el rango interdecil ); con tres puntos, la trimeana ; con una fracción fija de los puntos, la media recortada (incluida la media intercuartil ) y la media winsorizada ; con todos los puntos, la media.

Tenga en cuenta que algunas de estas (como la mediana o el rango medio) son medidas de tendencia central y se utilizan como estimadores de un parámetro de ubicación , como la media de una distribución normal, mientras que otras (como el rango o el rango recortado) son medidas de dispersión estadística y se utilizan como estimadores de un parámetro de escala , como la desviación estándar de una distribución normal.

Los estimadores L también pueden medir la forma de una distribución, más allá de la ubicación y la escala. Por ejemplo, la bisagra media menos la mediana es un estimador L de 3 términos que mide la asimetría , y otras diferencias de los estimadores medios dan medidas de asimetría en diferentes puntos de la cola. ^[1]

Los momentos L de muestra son estimadores L para el momento L de la población y tienen expresiones bastante complejas. Los momentos L generalmente se tratan por separado; consulte ese artículo para obtener más detalles.

Robustez

Los estimadores L suelen ser estadísticamente resistentes y tienen un punto de ruptura alto . Este se define como la fracción de las mediciones que se pueden cambiar arbitrariamente sin que la estimación resultante tienda a infinito (es decir, a "romperse"). El punto de ruptura de un estimador L se da por la estadística de orden más cercana al mínimo o máximo: por ejemplo, la mediana tiene un punto de ruptura del 50% (el más alto posible) y una media recortada o Winsorizada de n % tiene un punto de ruptura de n %.

No todos los estimadores L son robustos; si incluyen el mínimo o el máximo, entonces tienen un punto de ruptura de 0. Estos estimadores L no robustos incluyen el mínimo, el máximo, la media y el rango medio. Sin embargo, los equivalentes recortados son robustos.

Los estimadores L robustos utilizados para medir la dispersión, como el RIQ, proporcionan medidas de escala robustas .

Aplicaciones

En el uso práctico en estadística robusta , los estimadores L han sido reemplazados por estimadores M , que proporcionan estadísticas robustas que también tienen una alta eficiencia relativa , a costa de ser mucho más complejos y opacos computacionalmente.

Sin embargo, la simplicidad de los estimadores L significa que son fáciles de interpretar y visualizar, y los hace adecuados para la estadística descriptiva y la enseñanza de la estadística ; muchos pueden incluso calcularse mentalmente a partir de un resumen de cinco o siete números , o visualizarse a partir de un diagrama de caja . Los estimadores L desempeñan un papel fundamental en muchos enfoques de la estadística no paramétrica .

Aunque no son paramétricos, los estimadores L se utilizan con frecuencia para la estimación de parámetros , como lo indica su nombre, aunque a menudo deben ajustarse para obtener un estimador consistente e imparcial . La elección del estimador L y el ajuste dependen de la distribución cuyo parámetro se está estimando.

Por ejemplo, al estimar un parámetro de ubicación , para una distribución simétrica, un estimador L simétrico (como la mediana o la bisagra media) será imparcial. Sin embargo, si la distribución tiene sesgo , los estimadores L simétricos generalmente estarán sesgados y requerirán un ajuste. Por ejemplo, en una distribución sesgada, el sesgo no paramétrico (y los coeficientes de sesgo de Pearson ) miden el sesgo de la mediana como estimador de la media.

Al estimar un parámetro de escala , como cuando se utiliza un estimador L como una medida robusta de escala , como para estimar la varianza de la población o la desviación estándar de la población , generalmente se debe multiplicar por un factor de escala para convertirlo en un estimador consistente e imparcial; consulte parámetro de escala: estimación .

Por ejemplo, dividir el RIQ por (utilizando la función de error ) lo convierte en un estimador imparcial y consistente para la desviación estándar de la población si los datos siguen una distribución normal . $2{\sqrt {2}}\nombre del operador {erf} ^{-1}(1/2)\aprox 1,349$

Los estimadores L también pueden utilizarse como estadísticas por sí mismos; por ejemplo, la mediana es una medida de ubicación y el RIQ es una medida de dispersión. En estos casos, las estadísticas de muestra pueden actuar como estimadores de su propio valor esperado ; por ejemplo, la mediana de la muestra es un estimador de la mediana de la población.

Ventajas

Más allá de la simplicidad, los estimadores L también suelen ser fáciles de calcular y robustos.

Suponiendo que los datos están ordenados, los estimadores L que involucran solo unos pocos puntos se pueden calcular con muchas menos operaciones matemáticas que las estimaciones eficientes. ^[2]^[3] Antes de la llegada de las calculadoras electrónicas y las computadoras , estas proporcionaban una forma útil de extraer gran parte de la información de una muestra con un trabajo mínimo. Estas se mantuvieron en uso práctico hasta principios y mediados del siglo XX, cuando la clasificación automática de los datos de las tarjetas perforadas era posible, pero el cálculo seguía siendo difícil, ^[2] y todavía se utilizan hoy en día, para estimaciones dadas una lista de valores numéricos en forma no legible por máquina , donde la entrada de datos es más costosa que la clasificación manual. También permiten una estimación rápida.

Los estimadores L suelen ser mucho más robustos que los métodos convencionales de máxima eficiencia: la mediana es estadísticamente resistente al máximo , con un punto de ruptura del 50 % , y el rango medio recortado en un X % tiene un punto de ruptura del X %, mientras que la media de la muestra (que es de máxima eficiencia) es mínimamente robusta y se rompe para un solo valor atípico.

Eficiencia

Si bien los estimadores L no son tan eficientes como otras estadísticas, suelen tener una eficiencia relativa razonablemente alta y muestran que una gran fracción de la información utilizada en la estimación se puede obtener utilizando solo unos pocos puntos (uno, dos o tres). Alternativamente, muestran que las estadísticas de orden contienen una cantidad significativa de información.

Por ejemplo, en términos de eficiencia, dada una muestra de un parámetro numérico distribuido normalmente , la media aritmética (promedio) de la población se puede estimar con máxima eficiencia calculando la media de la muestra (sumando todos los miembros de la muestra y dividiéndola por el número de miembros).

Sin embargo, para un conjunto de datos grande (más de 100 puntos) de una población simétrica, la media se puede estimar de manera razonablemente eficiente en relación con la mejor estimación mediante estimadores L. Usando un solo punto, esto se hace tomando la mediana de la muestra, sin cálculos necesarios (excepto la clasificación); esto produce una eficiencia del 64% o mejor (para todos los n ). Usando dos puntos, una estimación simple es la bisagra media (el rango medio recortado al 25% ), pero una estimación más eficiente es el rango medio recortado al 29%, es decir, promediando los dos valores al 29% del camino desde los valores más pequeños y más grandes: los percentiles 29 y 71; esto tiene una eficiencia de aproximadamente el 81%. ^[3] Para tres puntos, se puede usar la trimeana (promedio de la mediana y la bisagra media), aunque el promedio de los percentiles 20, 50 y 80 produce una eficiencia del 88%. El uso de más puntos produce una mayor eficiencia, aunque cabe destacar que solo se necesitan 3 puntos para lograr una eficiencia muy alta.

Para estimar la desviación estándar de una distribución normal, el rango interdecil escalado proporciona un estimador razonablemente eficiente, aunque al tomar en cambio el rango recortado del 7% (la diferencia entre los percentiles 7 y 93) y dividirlo por 3 (que corresponde al 86% de los datos de una distribución normal que se encuentran dentro de 1,5 desviaciones estándar de la media) se obtiene una estimación de aproximadamente el 65% de eficiencia. ^[3]

Para muestras pequeñas, los estimadores L también son relativamente eficientes: el resumen medio del tercer punto desde cada extremo tiene una eficiencia de alrededor del 84% para muestras de tamaño de aproximadamente 10, y el rango dividido por tiene una eficiencia razonablemente buena para tamaños de hasta 20, aunque esto disminuye con el aumento de n y el factor de escala se puede mejorar (eficiencia del 85% para 10 puntos). Otros estimadores heurísticos para muestras pequeñas incluyen el rango sobre n (para el error estándar) y el rango al cuadrado sobre la mediana (para el chi-cuadrado de una distribución de Poisson). ^[3] ${\sqrt {n}}$

Véase también

Referencias

^ Velleman y Hoaglin 1981.
^ desde Mosteller 2006.
^ abcd Evans 1955, Apéndice G: Estadísticas ineficientes, págs. 902–904.

Evans, Robley Dunglison (1955). El núcleo atómico. Serie internacional de física pura y aplicada. McGraw-Hill. pp. 972. ISBN 0-89874414-8.
Fraiman, R.; Meloche, J.; García-Escudero, LA; Gordaliza, A.; He, X. ; Maronna, R.; Yohai, VCJ; Sheather, SJ; McKean, JW; Small, CG; Wood, A.; Fraiman, R.; Meloche, J. (1999). "Estimación L multivariante". Test . 8 (2): 255–317. doi :10.1007/BF02595872.
Huber, Peter J. (2004). Estadísticas robustas . Nueva York: Wiley-Interscience. ISBN 0-471-65072-2.
Mosteller, Frederick (2006) [1946]. "Sobre algunas estadísticas útiles e ineficientes". En Fienberg, Stephen; Hoaglin, David (eds.). Artículos seleccionados de Frederick Mosteller . Springer Series in Statistics. Nueva York: Springer. págs. 69–100. doi :10.1007/978-0-387-44956-2_4. ISBN 978-0-387-20271-6.
Shao, Jun (2003). Estadística matemática . Berlín: Springer-Verlag. ISBN 0-387-95382-5.– artículo 5.2.2
Velleman, PF; Hoaglin, DC (1981). Aplicaciones, fundamentos y cálculo del análisis exploratorio de datos . ISBN 0-87150-409-X.