Una media truncada o media recortada es una medida estadística de tendencia central , muy similar a la media y la mediana . Implica el cálculo de la media después de descartar partes dadas de una distribución de probabilidad o muestra en el extremo superior e inferior, y, por lo general, descartar una cantidad igual de ambos. Esta cantidad de puntos que se descartarán generalmente se expresa como un porcentaje de la cantidad total de puntos, pero también puede expresarse como una cantidad fija de puntos.
En la mayoría de las aplicaciones estadísticas, se descartan entre el 5 y el 25 por ciento de los extremos. Por ejemplo, dado un conjunto de 8 puntos, un recorte del 12,5 % descartaría el valor mínimo y máximo de la muestra: los valores más pequeños y más grandes, y calcularía la media de los 6 puntos restantes. La media recortada al 25 % (cuando se descartan el 25 % más bajo y el 25 % más alto) se conoce como media intercuartil .
La mediana puede considerarse como una media completamente truncada y es la más robusta. Al igual que con otros estimadores recortados , la principal ventaja de la media recortada es la robustez y una mayor eficiencia para distribuciones mixtas y distribuciones de cola pesada (como la distribución de Cauchy ), a costa de una menor eficiencia para algunas otras distribuciones de cola menos pesada (como la distribución normal). Para distribuciones intermedias, las diferencias entre la eficiencia de la media y la mediana no son muy grandes, por ejemplo, para la distribución t de Student con 2 grados de libertad, las varianzas para la media y la mediana son casi iguales.
En algunas regiones de Europa Central también se le conoce como media de Windsor , [ cita requerida ] pero este nombre no debe confundirse con la media winsorizada : en esta última, las observaciones que la media recortada descartaría se reemplazan por el mayor/más pequeño de los valores restantes.
Descartar solo el máximo y el mínimo se conoce comomedia modificada , particularmente en las estadísticas de gestión.[1]Esto también se conoce como laPromedio olímpico (por ejemplo, en la agricultura de EE. UU., como laelección de ingresos promedio por cultivos), debido a su uso en eventos olímpicos, como elsistema de evaluación ISUenpatinaje artístico, para hacer que la puntuación sea robusta ante un solo juez atípico.[2]
Cuando el porcentaje de puntos a descartar no da como resultado un número entero, la media recortada se puede definir por interpolación, generalmente interpolación lineal, entre los números enteros más cercanos. Por ejemplo, si necesita calcular la media recortada del 15% de una muestra que contiene 10 entradas, estrictamente esto significaría descartar 1 punto de cada extremo (equivalente a la media recortada del 10%). Si se interpola, se calcularía en cambio la media recortada del 10% (descartando 1 punto de cada extremo) y la media recortada del 20% (descartando 2 puntos de cada extremo), y luego se interpolaría, en este caso promediando estos dos valores. De manera similar, si se interpola la media recortada del 12%, se tomaría el promedio ponderado : se ponderaría la media recortada del 10% por 0,8 y la media recortada del 20% por 0,2.
La media truncada es un estimador útil porque es menos sensible a los valores atípicos que la media, pero aun así dará una estimación razonable de la tendencia central o la media para muchos modelos estadísticos. En este sentido, se lo conoce como un estimador robusto . Por ejemplo, en su uso en el arbitraje olímpico, truncar el máximo y el mínimo evita que un solo juez aumente o reduzca la puntuación general al otorgar una puntuación excepcionalmente alta o baja.
Una situación en la que puede ser ventajoso utilizar una media truncada es cuando se estima el parámetro de ubicación de una distribución de Cauchy , una distribución de probabilidad en forma de campana con colas (mucho) más gruesas que una distribución normal . Se puede demostrar que la media truncada de las estadísticas de orden de muestra del 24 % central (es decir, truncar la muestra en un 38 % en cada extremo) produce una estimación para el parámetro de ubicación de la población que es más eficiente que usar la mediana de la muestra o la media de la muestra completa. [3] [4] Sin embargo, debido a las colas gruesas de la distribución de Cauchy, la eficiencia del estimador disminuye a medida que se utiliza más de la muestra en la estimación. [3] [4] Nótese que para la distribución de Cauchy, ni la media truncada, la media de la muestra completa o la mediana de la muestra representan un estimador de máxima verosimilitud , ni son tan asintóticamente eficientes como el estimador de máxima verosimilitud; sin embargo, la estimación de máxima verosimilitud es más difícil de calcular, lo que deja a la media truncada como una alternativa útil. [4] [5]
Es posible realizar una prueba t de Student basada en la media truncada, que se denomina prueba t de Yuen, [6] [7] que también tiene varias implementaciones en R. [8] [9]
El método de puntuación utilizado en muchos deportes que son evaluados por un panel de jueces es una media truncada: descartar las puntuaciones más bajas y más altas; calcular el valor medio de las puntuaciones restantes . [10]
La tasa de interés de referencia Libor se calcula como una media recortada: dadas 18 respuestas, se descartan las 4 primeras y las 4 últimas, y se hace un promedio de las 10 restantes (lo que produce un factor de recorte de 4/18 ≈ 22%). [11]
Consideremos el conjunto de datos que consta de:
El percentil 5 (−6,75) se encuentra entre −40 y −5, mientras que el percentil 95 (148,6) se encuentra entre 101 y 1053 (los valores se muestran en negrita). Entonces, una media recortada al 5% daría como resultado lo siguiente:
Este ejemplo se puede comparar con el que utiliza el procedimiento Winsorising .
Una vez que se compilan las cotizaciones, la tasa LIBOR utiliza un proceso de media recortada, en el que se descartan los valores más altos y más bajos y se promedian los valores restantes. Esto a veces se denomina "promedio olímpico" por su uso en los Juegos Olímpicos para eliminar el impacto de un juez parcial en la puntuación final de un atleta.
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )