Medida estadística
La desviación cuadrática media ( RMSD ) o el error cuadrático medio ( RMSE ) es una de dos medidas estrechamente relacionadas y frecuentemente utilizadas de las diferencias entre los valores verdaderos o predichos por un lado y los valores observados o un estimador por el otro. La desviación es típicamente simplemente una diferencia de escalares ; también se puede generalizar a las longitudes vectoriales de un desplazamiento , como en el concepto bioinformático de desviación cuadrática media de las posiciones atómicas .
RMSD de una muestra
La desviación estándar media de una muestra es la media cuadrática de las diferencias entre los valores observados y los predichos. Estas desviaciones se denominan residuos cuando los cálculos se realizan sobre la muestra de datos que se utilizó para la estimación (y, por lo tanto, siempre se refieren a una estimación) y se denominan errores (o errores de predicción) cuando se calculan fuera de la muestra (es decir, sobre el conjunto completo, haciendo referencia a un valor verdadero en lugar de una estimación). La desviación estándar media sirve para agregar las magnitudes de los errores en las predicciones para varios puntos de datos en una única medida de poder predictivo. La desviación estándar media es una medida de precisión , para comparar los errores de predicción de diferentes modelos para un conjunto de datos en particular y no entre conjuntos de datos, ya que depende de la escala. [1]
El valor RMSD siempre es no negativo y un valor de 0 (que casi nunca se alcanza en la práctica) indicaría un ajuste perfecto a los datos. En general, un valor RMSD más bajo es mejor que uno más alto. Sin embargo, las comparaciones entre distintos tipos de datos no serían válidas porque la medida depende de la escala de los números utilizados.
RMSD es la raíz cuadrada del promedio de los errores al cuadrado. El efecto de cada error en RMSD es proporcional al tamaño del error al cuadrado; por lo tanto, los errores más grandes tienen un efecto desproporcionadamente grande en RMSD. En consecuencia, RMSD es sensible a los valores atípicos . [2] [3]
Fórmulas
Estimador
El RMSD de un estimador con respecto a un parámetro estimado se define como la raíz cuadrada del error cuadrático medio :
Para un estimador imparcial , la RMSD es la raíz cuadrada de la varianza , conocida como desviación estándar .
Muestras
Si X 1 , ..., X n es una muestra de una población con valor medio verdadero , entonces el RMSD de la muestra es
- .
La RMSD de los valores predichos para tiempos t de la variable dependiente de una regresión con variables observadas durante T tiempos, se calcula para T predicciones diferentes como la raíz cuadrada de la media de los cuadrados de las desviaciones:
(Para regresiones sobre datos transversales , el subíndice t se reemplaza por i y T se reemplaza por n ).
En algunas disciplinas, la RMSD se utiliza para comparar las diferencias entre dos cosas que pueden variar, ninguna de las cuales se acepta como "estándar". Por ejemplo, al medir la diferencia promedio entre dos series temporales y , la fórmula se convierte en
Normalización
La normalización de la desviación estándar media facilita la comparación entre conjuntos de datos o modelos con diferentes escalas. Aunque no existe un método de normalización consistente en la literatura, las opciones más comunes son la media o el rango (definido como el valor máximo menos el valor mínimo) de los datos medidos: [4]
- o .
Este valor se conoce comúnmente como desviación o error cuadrático medio normalizado (NRMSD o NRMSE) y, a menudo, se expresa como un porcentaje, donde los valores más bajos indican una menor varianza residual. Esto también se denomina coeficiente de variación o porcentaje RMS . En muchos casos, especialmente para muestras más pequeñas, es probable que el rango de la muestra se vea afectado por el tamaño de la muestra, lo que dificultaría las comparaciones.
Otro método posible para hacer que la desviación estándar media sea una medida de comparación más útil es dividir la desviación estándar media por el rango intercuartil (RIC). Al dividir la desviación estándar media por el RIC, el valor normalizado se vuelve menos sensible a los valores extremos de la variable objetivo.
- dónde
con y donde CDF −1 es la función cuantil .
Al normalizar por el valor medio de las mediciones, se puede utilizar el término coeficiente de variación del RMSD, CV(RMSD) para evitar ambigüedades. [5] Esto es análogo al coeficiente de variación con el RMSD tomando el lugar de la desviación estándar .
Error absoluto medio
Algunos investigadores [ ¿quiénes? ] han recomendado [ ¿dónde? ] el uso del error absoluto medio (MAE) en lugar de la desviación cuadrática media. El MAE posee ventajas en cuanto a interpretación sobre el RMSD. El MAE es el promedio de los valores absolutos de los errores. El MAE es fundamentalmente más fácil de entender que la raíz cuadrada del promedio de los errores al cuadrado. Además, cada error influye en el MAE en proporción directa al valor absoluto del error, lo que no sucede con el RMSD. [2]
Aplicaciones
- En meteorología , ver con qué eficacia un modelo matemático predice el comportamiento de la atmósfera .
- En bioinformática , la desviación cuadrática media de las posiciones atómicas es la medida de la distancia promedio entre los átomos de proteínas superpuestas .
- En el diseño de fármacos basado en la estructura , el RMSD es una medida de la diferencia entre una conformación cristalina de la conformación del ligando y una predicción de acoplamiento .
- En economía , el RMSD se utiliza para determinar si un modelo económico se ajusta a los indicadores económicos . Algunos expertos han argumentado que el RMSD es menos confiable que el Error Absoluto Relativo. [6]
- En psicología experimental , el RMSD se utiliza para evaluar qué tan bien los modelos matemáticos o computacionales del comportamiento explican el comportamiento observado empíricamente.
- En SIG , el RMSD es una medida utilizada para evaluar la precisión del análisis espacial y la teledetección.
- En hidrogeología , RMSD y NRMSD se utilizan para evaluar la calibración de un modelo de aguas subterráneas. [7]
- En la ciencia de la imagen , el RMSD es parte de la relación señal-ruido máxima , una medida utilizada para evaluar qué tan bien funciona un método para reconstruir una imagen en relación con la imagen original.
- En neurociencia computacional , el RMSD se utiliza para evaluar qué tan bien un sistema aprende un modelo determinado. [8]
- En la espectroscopia de resonancia magnética nuclear de proteínas , el RMSD se utiliza como medida para estimar la calidad del conjunto de estructuras obtenido.
- Las propuestas para el Premio Netflix se evaluaron utilizando el RMSD de los valores "reales" no revelados del conjunto de datos de prueba.
- En la simulación del consumo energético de los edificios, el RMSE y el CV(RMSE) se utilizan para calibrar los modelos para medir el rendimiento del edificio . [9]
- En cristalografía de rayos X , RMSD (y RMSZ) se utiliza para medir la desviación de las coordenadas internas moleculares respecto de los valores de la biblioteca de restricciones.
- En la teoría de control, el RMSE se utiliza como una medida de calidad para evaluar el desempeño de un observador de estado . [10]
- En dinámica de fluidos , la desviación cuadrática media normalizada (NRMSD), el coeficiente de variación (CV) y el porcentaje RMS se utilizan para cuantificar la uniformidad del comportamiento del flujo, como el perfil de velocidad, la distribución de temperatura o la concentración de especies de gas. El valor se compara con los estándares de la industria para optimizar el diseño de equipos y procesos de flujo y térmicos.
Véase también
Referencias
- ^ Hyndman, Rob J.; Koehler, Anne B. (2006). "Otra mirada a las medidas de precisión de los pronósticos". Revista internacional de pronósticos . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi :10.1016/j.ijforecast.2006.03.001. S2CID 15947215.
- ^ ab Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "Componentes de información para la comparación de resolución múltiple entre mapas que comparten una variable real" (PDF) . Estadísticas ecológicas ambientales . 15 (2): 111–142. Bibcode :2008EnvES..15..111P. doi :10.1007/s10651-007-0043-y. S2CID 21427573.
- ^ Willmott, Cort; Matsuura, Kenji (2006). "Sobre el uso de medidas de error dimensionadas para evaluar el rendimiento de los interpoladores espaciales". Revista Internacional de Ciencias de la Información Geográfica . 20 (1): 89–102. Bibcode :2006IJGIS..20...89W. doi :10.1080/13658810500286976. S2CID 15407960.
- ^ "Wiki del Programa de Investigación de Ensenadas Costeras (CIRP) - Estadísticas" . Consultado el 4 de febrero de 2015 .
- ^ "Preguntas frecuentes: ¿Qué es el coeficiente de variación?" . Consultado el 19 de febrero de 2019 .
- ^ Armstrong, J. Scott; Collopy, Fred (1992). "Medidas de error para generalizar sobre métodos de pronóstico: comparaciones empíricas" (PDF) . Revista internacional de pronóstico . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi :10.1016/0169-2070(92)90008-w. S2CID 11034360.
- ^ Anderson, MP; Woessner, WW (1992). Modelado aplicado de aguas subterráneas: simulación de flujo y transporte advectivo (2.ª ed.). Academic Press.
- ^ Modelo de red neuronal de conjunto
- ^ ANSI/BPI-2400-S-2012: Práctica estándar para la calificación estandarizada de predicciones de ahorro de energía en toda la casa mediante calibración del historial de uso de energía
- ^ https://kalman-filter.com/root-mean-square-error