Una media winsorizada es una medida estadística winsorizada de tendencia central , muy similar a la media y la mediana , e incluso más similar a la media truncada . Implica el cálculo de la media después de la winsorización , reemplazando partes dadas de una distribución de probabilidad o muestra en el extremo superior e inferior con los valores restantes más extremos, [1] generalmente haciéndolo para una cantidad igual de ambos extremos; a menudo se reemplazan entre el 10 y el 25 por ciento de los extremos. La media winsorizada se puede expresar de manera equivalente como un promedio ponderado de la media truncada y los cuantiles en los que está limitada, lo que corresponde a reemplazar partes con los cuantiles correspondientes.
La media winsorizada es un estimador útil porque, al retener los valores atípicos sin tomarlos demasiado literalmente, es menos sensible a las observaciones en los extremos que la media simple y aún así generará una estimación razonable de la tendencia central o la media para casi todos los modelos estadísticos. En este sentido, se lo conoce como un estimador robusto .
La media winsorizada utiliza más información de la distribución o muestra que la mediana . Sin embargo, a menos que la distribución subyacente sea simétrica , es poco probable que la media winsorizada de una muestra produzca un estimador imparcial para la media o la mediana.
Para una muestra de 10 números (desde x (1) , el más pequeño, hasta x (10), el más grande; notación estadística de orden ), la media winsorizada del 10 % es
La clave está en la repetición de x (2) y x (9) : los extras sustituyen a los valores originales x (1) y x (10) que han sido descartados y reemplazados.
Esto equivale a un promedio ponderado de 0,1 veces el percentil 5 ( x (2) ), 0,8 veces la media recortada al 10% y 0,1 veces el percentil 95 ( x (9) ).