stringtranslate.com

Desviación absoluta media

La desviación absoluta media ( DAP ) de un conjunto de datos es el promedio de las desviaciones absolutas con respecto a un punto central . Es una estadística resumen de la dispersión o variabilidad estadística . En su forma general, el punto central puede ser una media , una mediana , una moda o el resultado de cualquier otra medida de tendencia central o cualquier valor de referencia relacionado con el conjunto de datos dado. La DAP incluye la desviación absoluta media y la desviación absoluta mediana (ambas abreviadas como MAD ).

Medidas de dispersión

Varias medidas de dispersión estadística se definen en términos de la desviación absoluta. El término "desviación absoluta media" no identifica de forma única una medida de dispersión estadística , ya que existen varias medidas que se pueden utilizar para medir desviaciones absolutas, y también hay varias medidas de tendencia central que se pueden utilizar. Por lo tanto, para identificar de forma única la desviación absoluta es necesario especificar tanto la medida de desviación como la medida de tendencia central. La literatura estadística aún no ha adoptado una notación estándar, ya que tanto la desviación absoluta media alrededor de la media como la desviación absoluta mediana alrededor de la mediana se han denotado por sus iniciales "MAD" en la literatura, lo que puede dar lugar a confusión, ya que generalmente tienen valores considerablemente diferentes entre sí.

Desviación absoluta media alrededor de un punto central

La desviación absoluta media de un conjunto { x 1 , x 2 , ..., x n } es

La elección de la medida de tendencia central, , tiene un efecto marcado en el valor de la desviación media. Por ejemplo, para el conjunto de datos {2, 2, 3, 4, 14}:

Desviación absoluta media alrededor de la media

La desviación absoluta media (DMA), también denominada "desviación media" o, en ocasiones, "desviación absoluta promedio", es la media de las desviaciones absolutas de los datos en torno a la media de los mismos: la distancia media (absoluta) con respecto a la media. "Desviación absoluta promedio" puede referirse a este uso o a la forma general con respecto a un punto central específico (véase más arriba).

Se ha propuesto utilizar MAD en lugar de la desviación estándar , ya que se corresponde mejor con la vida real. [1] Debido a que la MAD es una medida de variabilidad más simple que la desviación estándar , puede ser útil en la enseñanza escolar. [2] [3]

La precisión de los pronósticos de este método está muy relacionada con el método del error cuadrático medio (MSE), que es simplemente el error cuadrático medio de los pronósticos. Aunque estos métodos están muy relacionados, el MAD se utiliza con más frecuencia porque es más fácil de calcular (evita la necesidad de elevar al cuadrado) [4] y más fácil de entender. [5]

Para la distribución normal , la razón entre la desviación media absoluta y la desviación estándar es . Por lo tanto, si X es una variable aleatoria distribuida normalmente con un valor esperado de 0, entonces, véase Geary (1935): [6] En otras palabras, para una distribución normal, la desviación media absoluta es aproximadamente 0,8 veces la desviación estándar. Sin embargo, las mediciones en la muestra proporcionan valores de la razón entre la desviación media promedio y la desviación estándar para una muestra gaussiana dada n con los siguientes límites: , con un sesgo para n pequeño . [7]

La desviación absoluta media de la media es menor o igual a la desviación estándar ; una forma de demostrarlo se basa en la desigualdad de Jensen .

Prueba

La desigualdad de Jensen es , donde φ es una función convexa, esto implica que:

Dado que ambos lados son positivos y la raíz cuadrada es una función monótonamente creciente en el dominio positivo:

Para un caso general de esta afirmación, véase la desigualdad de Hölder .

Desviación absoluta media alrededor de la mediana

La mediana es el punto en torno al cual se minimiza la desviación media. La mediana MAD ofrece una medida directa de la escala de una variable aleatoria en torno a su mediana.

Este es el estimador de máxima verosimilitud del parámetro de escala de la distribución de Laplace .

Como la mediana minimiza la distancia absoluta promedio, tenemos . La desviación absoluta media con respecto a la mediana es menor o igual que la desviación absoluta media con respecto a la media. De hecho, la desviación absoluta media con respecto a la mediana siempre es menor o igual que la desviación absoluta media con respecto a cualquier otro número fijo.

Utilizando la función de dispersión general, Habib (2011) definió la MAD sobre la mediana como el punto donde se encuentra la función indicadora.

Esta representación permite obtener coeficientes de correlación mediana de MAD. [ cita requerida ]

Desviación absoluta media alrededor de un punto central

Aunque en principio la media o cualquier otro punto central podría tomarse como punto central para la desviación absoluta mediana, lo más frecuente es tomar en su lugar el valor mediano .

Desviación absoluta media alrededor de la mediana

La desviación absoluta media (también MAD) es la mediana de la desviación absoluta con respecto a la mediana . Es un estimador robusto de la dispersión .

Para el ejemplo {2, 2, 3, 4, 14}: 3 es la mediana, por lo que las desviaciones absolutas de la mediana son {1, 1, 0, 1, 11} (reordenadas como {0, 1, 1, 1, 11}) con una mediana de 1, en este caso no afectada por el valor del valor atípico 14, por lo que la desviación absoluta mediana es 1.

Para una distribución simétrica, la desviación absoluta mediana es igual a la mitad del rango intercuartil .

Desviación absoluta máxima

La desviación absoluta máxima en torno a un punto arbitrario es la desviación absoluta máxima de una muestra con respecto a ese punto. Si bien no es estrictamente una medida de tendencia central, la desviación absoluta máxima se puede hallar utilizando la fórmula para la desviación absoluta promedio como se indica anteriormente con , donde es el máximo de la muestra .

Minimización

Las medidas de dispersión estadística derivadas de la desviación absoluta caracterizan a varias medidas de tendencia central como minimizadoras de la dispersión: La mediana es la medida de tendencia central más asociada con la desviación absoluta. Algunos parámetros de ubicación se pueden comparar de la siguiente manera:

Estimación

La desviación absoluta media de una muestra es un estimador sesgado de la desviación absoluta media de la población. Para que la desviación absoluta sea un estimador insesgado, el valor esperado (promedio) de todas las desviaciones absolutas de la muestra debe ser igual a la desviación absoluta de la población. Sin embargo, no es así. Para la población 1, 2, 3, tanto la desviación absoluta de la población con respecto a la mediana como la desviación absoluta de la población con respecto a la media son 2/3. El promedio de todas las desviaciones absolutas de la muestra con respecto a la media de tamaño 3 que se pueden extraer de la población es 44/81, mientras que el promedio de todas las desviaciones absolutas de la muestra con respecto a la mediana es 4/9. Por lo tanto, la desviación absoluta es un estimador sesgado.

Sin embargo, este argumento se basa en la noción de imparcialidad media. Cada medida de ubicación tiene su propia forma de imparcialidad (véase la entrada sobre estimador sesgado ). La forma de imparcialidad relevante aquí es la imparcialidad mediana.

Véase también

Referencias

  1. ^ Taleb, Nassim Nicholas (2014). "¿Qué idea científica está lista para retirarse?". Edge . Archivado desde el original el 16 de enero de 2014. Consultado el 16 de enero de 2014 .{{cite web}}: CS1 maint: bot: original URL status unknown (link)
  2. ^ Kader, Gary (marzo de 1999). "Means and MADS". Enseñanza de las matemáticas en la escuela secundaria . 4 (6): 398–403. Archivado desde el original el 18 de mayo de 2013. Consultado el 20 de febrero de 2013 .
  3. ^ Franklin, Christine, Gary Kader, Denise Mewborn, Jerry Moreno, Roxy Peck , Mike Perry y Richard Scheaffer (2007). Pautas para la evaluación y la enseñanza de la enseñanza de la estadística (PDF) . Asociación Estadounidense de Estadística. ISBN 978-0-9791747-1-1. Archivado (PDF) del original el 7 de marzo de 2013. Consultado el 20 de febrero de 2013 .{{cite book}}: CS1 maint: multiple names: authors list (link)
  4. ^ Nahmias, Steven; Olsen, Tava Lennon (2015), Análisis de producción y operaciones (7.ª ed.), Waveland Press, pág. 62, ISBN 9781478628248, MAD es a menudo el método preferido para medir el error de pronóstico porque no requiere elevar al cuadrado.
  5. ^ Stadtler, Hartmut; Kilger, Christoph; Meyr, Herbert, eds. (2014), Gestión de la cadena de suministro y planificación avanzada: conceptos, modelos, software y estudios de casos, Springer Texts in Business and Economics (5.ª ed.), Springer, pág. 143, ISBN 9783642553097, el significado del MAD es más fácil de interpretar.
  6. ^ Geary, RC (1935). La relación entre la desviación media y la desviación estándar como prueba de normalidad. Biometrika, 27(3/4), 310–332.
  7. ^ Véase también los artículos de Geary de 1936 y 1946: Geary, RC (1936). Momentos de la relación entre la desviación media y la desviación estándar para muestras normales. Biometrika, 28(3/4), 295–307 y Geary, RC (1947). Pruebas de normalidad. Biometrika, 34(3/4), 209–242.

Enlaces externos