stringtranslate.com

Desviación cuadrática media

La desviación cuadrática media ( RMSD ) o el error cuadrático medio ( RMSE ) es una de dos medidas estrechamente relacionadas y frecuentemente utilizadas de las diferencias entre los valores verdaderos o predichos, por un lado, y los valores observados o un estimador , por el otro.

RMSD de una muestra

La desviación estándar media de una muestra es la media cuadrática de las diferencias entre los valores observados y los predichos. Estas desviaciones se denominan residuos cuando los cálculos se realizan sobre la muestra de datos que se utilizó para la estimación (y, por lo tanto, siempre se refieren a una estimación) y se denominan errores (o errores de predicción) cuando se calculan fuera de la muestra (es decir, sobre el conjunto completo, haciendo referencia a un valor verdadero en lugar de una estimación). La desviación estándar media sirve para agregar las magnitudes de los errores en las predicciones para varios puntos de datos en una única medida de poder predictivo. La desviación estándar media es una medida de precisión , para comparar los errores de predicción de diferentes modelos para un conjunto de datos en particular y no entre conjuntos de datos, ya que depende de la escala. [1]

El valor RMSD siempre es no negativo y un valor de 0 (que casi nunca se alcanza en la práctica) indicaría un ajuste perfecto a los datos. En general, un valor RMSD más bajo es mejor que uno más alto. Sin embargo, las comparaciones entre distintos tipos de datos no serían válidas porque la medida depende de la escala de los números utilizados.

RMSD es la raíz cuadrada del promedio de los errores al cuadrado. El efecto de cada error en RMSD es proporcional al tamaño del error al cuadrado; por lo tanto, los errores más grandes tienen un efecto desproporcionadamente grande en RMSD. En consecuencia, RMSD es sensible a los valores atípicos . [2] [3]

Fórmulas

Estimador

El RMSD de un estimador con respecto a un parámetro estimado se define como la raíz cuadrada del error cuadrático medio :

Para un estimador imparcial , la RMSD es la raíz cuadrada de la varianza , conocida como desviación estándar .

Muestras

Si X 1 , ..., X n es una muestra de una población con valor medio verdadero , entonces el RMSD de la muestra es

.

La RMSD de los valores predichos para tiempos t de la variable dependiente de una regresión con variables observadas durante T tiempos, se calcula para T predicciones diferentes como la raíz cuadrada de la media de los cuadrados de las desviaciones:

(Para regresiones sobre datos transversales , el subíndice t se reemplaza por i y T se reemplaza por n ).

En algunas disciplinas, la RMSD se utiliza para comparar las diferencias entre dos cosas que pueden variar, ninguna de las cuales se acepta como "estándar". Por ejemplo, al medir la diferencia promedio entre dos series temporales y , la fórmula se convierte en

Normalización

La normalización de la desviación estándar media facilita la comparación entre conjuntos de datos o modelos con diferentes escalas. Aunque no existe un método de normalización consistente en la literatura, las opciones más comunes son la media o el rango (definido como el valor máximo menos el valor mínimo) de los datos medidos: [4]

o .

Este valor se conoce comúnmente como desviación o error cuadrático medio normalizado (NRMSD o NRMSE) y, a menudo, se expresa como un porcentaje, donde los valores más bajos indican una menor varianza residual. Esto también se denomina coeficiente de variación o porcentaje RMS . En muchos casos, especialmente para muestras más pequeñas, es probable que el rango de la muestra se vea afectado por el tamaño de la muestra, lo que dificultaría las comparaciones.

Otro método posible para hacer que la desviación estándar media sea una medida de comparación más útil es dividir la desviación estándar media por el rango intercuartil (RIC). Al dividir la desviación estándar media por el RIC, el valor normalizado se vuelve menos sensible a los valores extremos de la variable objetivo.

dónde

con y donde CDF −1 es la función cuantil .

Al normalizar por el valor medio de las mediciones, se puede utilizar el término coeficiente de variación del RMSD, CV(RMSD) para evitar ambigüedades. [5] Esto es análogo al coeficiente de variación con el RMSD tomando el lugar de la desviación estándar .

Error absoluto medio

Algunos investigadores [ ¿quiénes? ] han recomendado [ ¿dónde? ] el uso del error absoluto medio (MAE) en lugar de la desviación cuadrática media. El MAE posee ventajas en cuanto a interpretabilidad sobre el RMSD. El MAE es el promedio de los valores absolutos de los errores. El MAE es fundamentalmente más fácil de entender que la raíz cuadrada del promedio de los errores al cuadrado. Además, cada error influye en el MAE en proporción directa al valor absoluto del error, lo que no sucede con el RMSD. [2]

Aplicaciones

Véase también

Referencias

  1. ^ Hyndman, Rob J.; Koehler, Anne B. (2006). "Otra mirada a las medidas de precisión de los pronósticos". Revista internacional de pronósticos . 22 (4): 679–688. CiteSeerX  10.1.1.154.9771 . doi :10.1016/j.ijforecast.2006.03.001. S2CID  15947215.
  2. ^ ab Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "Componentes de información para la comparación de resolución múltiple entre mapas que comparten una variable real" (PDF) . Estadísticas ecológicas ambientales . 15 (2): 111–142. Bibcode :2008EnvES..15..111P. doi :10.1007/s10651-007-0043-y. S2CID  21427573.
  3. ^ Willmott, Cort; Matsuura, Kenji (2006). "Sobre el uso de medidas de error dimensionadas para evaluar el rendimiento de los interpoladores espaciales". Revista Internacional de Ciencias de la Información Geográfica . 20 (1): 89–102. Bibcode :2006IJGIS..20...89W. doi :10.1080/13658810500286976. S2CID  15407960.
  4. ^ "Wiki del Programa de Investigación de Ensenadas Costeras (CIRP) - Estadísticas" . Consultado el 4 de febrero de 2015 .
  5. ^ "Preguntas frecuentes: ¿Qué es el coeficiente de variación?" . Consultado el 19 de febrero de 2019 .
  6. ^ Armstrong, J. Scott; Collopy, Fred (1992). "Medidas de error para generalizar sobre métodos de pronóstico: comparaciones empíricas" (PDF) . Revista internacional de pronóstico . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi :10.1016/0169-2070(92)90008-w. S2CID  11034360. 
  7. ^ Anderson, MP; Woessner, WW (1992). Modelado aplicado de aguas subterráneas: simulación de flujo y transporte advectivo (2.ª ed.). Academic Press.
  8. ^ Modelo de red neuronal de conjunto
  9. ^ ANSI/BPI-2400-S-2012: Práctica estándar para la calificación estandarizada de predicciones de ahorro de energía en toda la casa mediante calibración del historial de uso de energía
  10. ^ https://kalman-filter.com/root-mean-square-error