Error porcentual absoluto medio

El error porcentual absoluto medio ( MAPE ), también conocido como desviación porcentual absoluta media ( MAPD ), es una medida de la precisión de la predicción de un método de pronóstico en estadística . Generalmente expresa la precisión como una proporción definida por la fórmula:

{\mbox{MAPE}}=100{\frac {1}{n}}\sum _{t=1}^{n}\left|{\frac {A_{t}-F_{t} }{A_ {t}}}\derecha|

donde $A t$ es el valor real y $F t$ es el valor previsto. Su diferencia se divide por el valor real $A t$ . El valor absoluto de esta relación se suma para cada punto pronosticado en el tiempo y se divide por el número de puntos ajustados $n$ .

MAPE en problemas de regresión

El error porcentual absoluto medio se utiliza comúnmente como función de pérdida para problemas de regresión y en la evaluación de modelos, debido a su interpretación muy intuitiva en términos de error relativo.

Definición

Considere una configuración de regresión estándar en la que los datos se describen completamente mediante un par aleatorio con valores en y $n$ iid copias de . Los modelos de regresión tienen como objetivo encontrar un buen modelo para el par, es decir, una función medible $g$ desde hasta tal que sea cercana a $Y.$ $Z=(X,Y)$ $\mathbb {R} ^{d}\times \mathbb {R}$ ${\ Displaystyle (X_ {1}, Y_ {1}),..., (X_ {n}, Y_ {n})}$ $(X,Y)$ $\mathbb {R} ^{d}$ $\mathbb {R}$ $g(X)$

En el entorno de regresión clásica, la cercanía de Y $se$ mide mediante el riesgo $L$ $2$ , también llamado error cuadrático medio (MSE). En el contexto de la regresión MAPE, ^[1] la cercanía de Y $se$ mide mediante el MAPE, y el objetivo de las regresiones MAPE es encontrar un modelo tal que: $g(X)$ $g(X)$ $g_{\text{MAPE}}$

$g_{\mathrm {MAPE} }(x)=\arg \min _ {g\in {\mathcal {G}}}\mathbb {E} {\Biggl [}\left|{\frac {g (X)-Y}{Y}}\right||X=x{\Biggr ]}$

¿Dónde está la clase de modelos considerados (por ejemplo, modelos lineales)? ${\mathcal {G}}$

En la práctica

En la práctica, se puede estimar mediante la estrategia empírica de minimización de riesgos , lo que lleva a $g_{\text{MAPE}}(x)$

${\widehat {g}}_{\text{MAPE}}(x)=\arg \min _{g\in {\mathcal {G}}}\sum _{i=1}^{n }\left|{\frac {g(X_{i})-Y_{i}}{Y_{i}}}\right|$

Desde un punto de vista práctico, el uso de MAPE como función de calidad para el modelo de regresión equivale a realizar una regresión de error absoluto medio ponderado (MAE), también conocida como regresión cuantil . Esta propiedad es trivial ya que

${\widehat {g}}_{\text{MAPE}}(x)=\arg \min _{g\in {\mathcal {G}}}\sum _{i=1}^{n }\omega (Y_{i})\left|g(X_{i})-Y_{i}\right|{\mbox{ con }}\omega (Y_{i})=\left|{\frac { 1}{Y_{i}}}\derecha|$

Como consecuencia, el uso de MAPE es muy fácil en la práctica, por ejemplo utilizando bibliotecas existentes para regresión cuantil que permiten ponderaciones.

Consistencia

El uso del MAPE como función de pérdidas para el análisis de regresión es factible tanto desde el punto de vista práctico como teórico, ya que se puede demostrar la existencia de un modelo óptimo y la consistencia de la minimización empírica del riesgo. ^[1]

WMAPE

WMAPE (a veces escrito wMAPE ) significa error porcentual absoluto medio ponderado. ^[2] Es una medida utilizada para evaluar el desempeño de modelos de regresión o pronóstico. Es una variante de MAPE en la que los errores porcentuales absolutos medios se tratan como una media aritmética ponderada. Lo más habitual es que los errores porcentuales absolutos se ponderen según los datos reales (por ejemplo, en el caso de la previsión de ventas, los errores se ponderan según el volumen de ventas). ^[3] Efectivamente, esto supera el problema del 'error infinito'. ^[4] Su fórmula es: ^[4] ${\mbox{wMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}\left(w_{i}\cdot {\tfrac {\left|A_{i}- F_{i}\right|}{|A_{i}|}}\right)}{\displaystyle \sum _{i=1}^{n}w_{i}}}={\frac {\displaystyle \ suma _{i=1}^{n}\left(|A_{i}|\cdot {\tfrac {\left|A_{i}-F_{i}\right|}{|A_{i}|} }\right)}{\displaystyle \sum _ {i=1}^{n}\left|A_{i}\right|}}$

Donde está el peso, es un vector de los datos reales y es el pronóstico o predicción. Sin embargo, esto efectivamente se simplifica a una fórmula mucho más simple: $w_{i}$ $A$ $F$ ${\mbox{wMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}\left|A_{i}-F_{i}\right|}{\displaystyle \sum _{i=1}^{n}\left|A_{i}\right|}}$

De manera confusa, a veces, cuando las personas se refieren a wMAPE, se refieren a un modelo diferente en el que el numerador y el denominador de la fórmula de wMAPE anterior se ponderan nuevamente mediante otro conjunto de ponderaciones personalizadas . Quizás sería más exacto llamarlo MAPE de doble ponderación (wwMAPE). Su fórmula es: $w_{i}$ ${\mbox{wwMAPE}}={\frac {\displaystyle \sum _{i=1}^{n}w_{i}\left|A_{i}-F_{i}\right|}{\displaystyle \sum _{i=1}^{n}w_{i}\left|A_{i}\right|}}$

Asuntos

Aunque el concepto de MAPE suena muy simple y convincente, tiene importantes inconvenientes en la aplicación práctica ^[5] y existen muchos estudios sobre las deficiencias y los resultados engañosos de MAPE. ^[6]^[7]

No se puede utilizar si hay valores cero o cercanos a cero (lo que sucede a veces, por ejemplo en los datos de demanda) porque habría una división entre cero o valores de MAPE que tenderían al infinito. ^[8]
Para pronósticos que son demasiado bajos, el error porcentual no puede exceder el 100%, pero para pronósticos que son demasiado altos no hay límite superior para el error porcentual.
MAPE impone una penalización más severa a los errores negativos que a los errores positivos. ^[9] Como consecuencia, cuando se utiliza MAPE para comparar la precisión de los métodos de predicción, está sesgado porque seleccionará sistemáticamente un método cuyos pronósticos sean demasiado bajos. Este problema poco conocido pero grave se puede superar utilizando una medida de precisión basada en el logaritmo de la relación de precisión (la relación entre el valor previsto y el real), dada por . Este enfoque conduce a propiedades estadísticas superiores y también a predicciones que pueden interpretarse en términos de la media geométrica. ^[5] $A_{t}<F_{t}$ ${\textstyle \log \left({\frac {\text{predicted}}{\text{actual}}}\right)}$
La gente suele pensar que el MAPE se optimizará en la mediana. Pero, por ejemplo, un registro normal tiene una mediana de dónde, ya que está optimizado para MAPE . $e^{\mu }$ $e^{\mu -\sigma ^{2}}$

Para superar estos problemas con MAPE, existen otras medidas propuestas en la literatura:

Error escalado absoluto medio (MASE)
Error porcentual absoluto medio simétrico (sMAPE)
Precisión direccional media (MDA)
Error porcentual absoluto arctangente medio (MAAPE): MAAPE se puede considerar una pendiente como ángulo , mientras que MAPE es una pendiente como relación . ^[7]

Ver también

Enlaces externos

Error porcentual absoluto medio para modelos de regresión
Error porcentual absoluto medio (MAPE)
Errores sobre errores porcentuales: variantes de MAPE
Error porcentual absoluto arctangente medio (MAAPE)

Referencias

^ ab de Myttenaere, B Golden, B Le Grand, F Rossi (2015). "Error porcentual absoluto medio para modelos de regresión", Neurocomputing 2016 arXiv :1605.02541
^ "Comprensión de la precisión del pronóstico: MAPE, WAPE, WMAPE".
^ "WMAPE: error porcentual absoluto medio ponderado".
^ ab "Errores de pronóstico estadístico".
^ ab Tofallis (2015). "Una mejor medida de la precisión de la predicción relativa para la selección y estimación de modelos", Journal of the Operational Research Society , 66(8):1352-1362. preimpresión archivada
^ Hyndman, Rob J. y Anne B. Koehler (2006). "Otra mirada a las medidas de precisión del pronóstico". Revista Internacional de Previsión , 22(4):679-688 doi:10.1016/j.ijforecast.2006.03.001.
^ ab Kim, Sungil y Heeyoung Kim (2016). "Una nueva métrica de error porcentual absoluto para pronósticos de demanda intermitente". Revista Internacional de Previsión , 32(3):669-679 doi:10.1016/j.ijforecast.2015.12.003.
^ Kim, Sungil; Kim, Heeyoung (1 de julio de 2016). "Una nueva métrica de error porcentual absoluto para previsiones de demanda intermitente". Revista internacional de previsión . 32 (3): 669–679. doi : 10.1016/j.ijforecast.2015.12.003 .
^ Makridakis, Spyros (1993) "Medidas de precisión: preocupaciones teóricas y prácticas". Revista Internacional de Previsión , 9(4):527-529 doi:10.1016/0169-2070(93)90079-3