stringtranslate.com

Propagación de la incertidumbre

En estadística , la propagación de la incertidumbre (o propagación del error ) es el efecto de las incertidumbres de las variables (o errores , más específicamente errores aleatorios ) sobre la incertidumbre de una función basada en ellas. Cuando las variables son valores de mediciones experimentales, tienen incertidumbres debido a limitaciones de medición (por ejemplo, precisión del instrumento ) que se propagan debido a la combinación de variables en la función.

La incertidumbre u se puede expresar de varias maneras. Puede definirse por el error absoluto Δ x . Las incertidumbres también se pueden definir por el error relativo x )/ x , que generalmente se escribe como un porcentaje. Lo más común es que la incertidumbre de una cantidad se cuantifique en términos de la desviación estándar , σ , que es la raíz cuadrada positiva de la varianza . El valor de una cantidad y su error se expresan entonces como un intervalo x ± u . Sin embargo, la forma más general de caracterizar la incertidumbre es especificando su distribución de probabilidad . Si se conoce o se puede suponer la distribución de probabilidad de la variable, en teoría es posible obtener cualquiera de sus estadísticas. En particular, es posible derivar límites de confianza para describir la región dentro de la cual se puede encontrar el valor verdadero de la variable. Por ejemplo, los límites de confianza del 68% para una variable unidimensional que pertenece a una distribución normal son aproximadamente ± una desviación estándar σ del valor central x , lo que significa que la región x ± σ cubrirá el valor verdadero en aproximadamente el 68% de los casos.

Si las incertidumbres están correlacionadas , entonces se debe tener en cuenta la covarianza . La correlación puede surgir de dos fuentes diferentes. En primer lugar, los errores de medición pueden estar correlacionados. En segundo lugar, cuando los valores subyacentes están correlacionados en una población, las incertidumbres en los promedios del grupo estarán correlacionadas. [1]

En un contexto general donde una función no lineal modifica los parámetros inciertos (correlacionados o no), las herramientas estándar para propagar la incertidumbre e inferir la distribución de probabilidad/estadísticas de la cantidad resultante son las técnicas de muestreo de la familia de métodos de Monte Carlo . [2] Para datos muy expansivos o funciones complejas, el cálculo de la propagación del error puede ser muy expansivo, por lo que puede ser necesario un modelo sustituto [3] o una estrategia de computación paralela [4] [5] [6] .

En algunos casos particulares, el cálculo de la propagación de la incertidumbre se puede realizar mediante procedimientos algebraicos simplistas. Algunos de estos escenarios se describen a continuación.

Combinaciones lineales

Sea un conjunto de m funciones, que son combinaciones lineales de variables con coeficientes de combinación : o en notación matricial,

Además, sea la matriz de varianza-covarianza de x = ( x 1 , ..., x n ) denotada por y sea el valor medio denotado por : es el producto externo .

Entonces, la matriz de varianza-covarianza de f está dada por

En notación de componentes, la ecuación se lee

Esta es la expresión más general para la propagación de errores de un conjunto de variables a otro. Cuando los errores en x no están correlacionados, la expresión general se simplifica a donde es la varianza del k -ésimo elemento del vector x . Nótese que, aunque los errores en x pueden no estar correlacionados, los errores en f están correlacionados en general; en otras palabras, incluso si es una matriz diagonal, es en general una matriz completa.

Las expresiones generales para una función f con valor escalar son un poco más simples (aquí a es un vector de fila):

Cada término de covarianza se puede expresar en términos del coeficiente de correlación por , de modo que una expresión alternativa para la varianza de f es

En el caso de que las variables en x no estén correlacionadas, esto se simplifica aún más a

En el caso simple de coeficientes y varianzas idénticos, encontramos

Para la media aritmética, , el resultado es el error estándar de la media :

Combinaciones no lineales

Cuando f es un conjunto de combinaciones no lineales de las variables x , se podría realizar una propagación de intervalos para calcular intervalos que contengan todos los valores consistentes para las variables. En un enfoque probabilístico, la función f generalmente debe linealizarse mediante una aproximación a una expansión de la serie de Taylor de primer orden , aunque en algunos casos, se pueden derivar fórmulas exactas que no dependen de la expansión como es el caso de la varianza exacta de productos. [7] La ​​expansión de Taylor sería: donde denota la derivada parcial de f k con respecto a la i -ésima variable, evaluada en el valor medio de todos los componentes del vector x . O en notación matricial , donde J es la matriz jacobiana . Dado que f 0 es una constante, no contribuye al error en f . Por lo tanto, la propagación del error sigue el caso lineal, anterior, pero reemplazando los coeficientes lineales, A ki y A kj por las derivadas parciales, y . En notación matricial, [8]

Es decir, se utiliza el jacobiano de la función para transformar las filas y columnas de la matriz de varianza-covarianza del argumento. Nótese que esto es equivalente a la expresión matricial para el caso lineal con .

Simplificación

Si se ignoran las correlaciones o se supone que existen variables independientes, se obtiene una fórmula común entre ingenieros y científicos experimentales para calcular la propagación del error: la fórmula de varianza: [9] donde representa la desviación estándar de la función , representa la desviación estándar de , representa la desviación estándar de , y así sucesivamente.

Esta fórmula se basa en las características lineales del gradiente de y, por lo tanto, es una buena estimación de la desviación estándar de siempre que sean lo suficientemente pequeñas. En concreto, la aproximación lineal de tiene que estar cerca de dentro de un entorno de radio . [10]

Ejemplo

Cualquier función diferenciable no lineal, , de dos variables, y , se puede expandir como Si tomamos la varianza en ambos lados y usamos la fórmula [11] para la varianza de una combinación lineal de variables, entonces obtenemos donde es la desviación estándar de la función , es la desviación estándar de , es la desviación estándar de y es la covarianza entre y .

En el caso particular de que , , . Entonces o donde es la correlación entre y .

Cuando las variables y no están correlacionadas, . Entonces

Advertencias y advertencias

Las estimaciones de error para funciones no lineales están sesgadas debido al uso de una expansión de serie truncada. El grado de este sesgo depende de la naturaleza de la función. Por ejemplo, el sesgo en el error calculado para log(1+ x ) aumenta a medida que x aumenta, ya que la expansión a x es una buena aproximación solo cuando x está cerca de cero.

Para funciones altamente no lineales, existen cinco categorías de enfoques probabilísticos para la propagación de la incertidumbre; [12] consulte Cuantificación de la incertidumbre para obtener más detalles.

Recíproco y recíproco desplazado

En el caso especial de la inversa o recíproca , donde sigue una distribución normal estándar , la distribución resultante es una distribución normal estándar recíproca y no hay varianza definible. [13]

Sin embargo, en el caso ligeramente más general de una función recíproca desplazada para seguir una distribución normal general, entonces las estadísticas de media y varianza existen en un sentido de valor principal , si la diferencia entre el polo y la media tiene un valor real. [14]

Proporciones

Las proporciones también son problemáticas; existen aproximaciones normales bajo ciertas condiciones.

Fórmulas de ejemplo

Esta tabla muestra las varianzas y desviaciones estándar de funciones simples de las variables reales con desviaciones estándar, covarianza y correlación. Los coeficientes de valor real y se suponen exactamente conocidos (determinísticos), es decir,

En las columnas de la derecha de la tabla, y son los valores esperados , y es el valor de la función calculado en esos valores.

Para las variables no correlacionadas ( , ) se pueden derivar expresiones para funciones más complicadas combinando funciones más simples. Por ejemplo, la multiplicación repetida, suponiendo que no hay correlación, da

Para el caso también tenemos la expresión de Goodman [7] para la varianza exacta: para el caso no correlacionado es y por lo tanto tenemos

Efecto de la correlación sobre las diferencias

Si A y B no están correlacionadas, su diferencia AB tendrá más varianza que cualquiera de ellas. Una correlación positiva creciente ( ) disminuirá la varianza de la diferencia, convergiendo a varianza cero para variables perfectamente correlacionadas con la misma varianza . Por otro lado, una correlación negativa ( ) aumentará aún más la varianza de la diferencia, en comparación con el caso no correlacionado.

Por ejemplo, la autosustracción f = AA tiene varianza cero solo si la variable está perfectamente autocorrelacionada ( ). Si A no está correlacionada, entonces la varianza de salida es el doble de la varianza de entrada, y si A está perfectamente anticorrelacionada, entonces la varianza de entrada se cuadruplica en la salida (observe f = aA aA en la tabla anterior).

Ejemplos de cálculos

Función tangente inversa

Podemos calcular la propagación de la incertidumbre para la función tangente inversa como un ejemplo de uso de derivadas parciales para propagar el error.

Defina dónde está la incertidumbre absoluta de nuestra medición de x . La derivada de f ( x ) con respecto a x es

Por lo tanto, nuestra incertidumbre propagada es donde está la incertidumbre propagada absoluta.

Medición de resistencia

Una aplicación práctica es un experimento en el que se mide la corriente , I , y el voltaje , V , en una resistencia para determinar la resistencia , R , utilizando la ley de Ohm , R = V / I.

Dadas las variables medidas con incertidumbres, I ± σ I y V ± σ V , y despreciando su posible correlación, la incertidumbre en la cantidad calculada, σ R , es:

Véase también

Referencias

  1. ^ Kirchner, James. "Data Analysis Toolkit #5: Uncertainty Analysis and Error Propagation" (PDF) . Laboratorio de sismología de Berkeley . Universidad de California . Consultado el 22 de abril de 2016 .
  2. ^ Kroese, DP; Taimre, T.; Botev, ZI (2011). Manual de métodos de Monte Carlo . John Wiley & Sons.
  3. ^ Ranftl, Sascha; von der Linden, Wolfgang (13 de noviembre de 2021). "Análisis sustituto bayesiano y propagación de la incertidumbre". Physical Sciences Forum . 3 (1): 6. arXiv : 2101.04038 . doi : 10.3390/psf2021003006 . ISSN  2673-9984.
  4. ^ Atanassova, E.; Gurov, T.; Karaivanova, A.; Ivanovska, S.; Durchova, M.; Dimitrov, D. (2016). "Sobre los enfoques de paralelización para la arquitectura Intel MIC". Actas de la conferencia AIP . 1773 (1): 070001. Bibcode :2016AIPC.1773g0001A. doi :10.1063/1.4964983.
  5. ^ Cunha Jr, A.; Nasser, R.; Sampaio, R.; Lopes, H.; Breitman, K. (2014). "Cuantificación de la incertidumbre a través del método de Monte Carlo en un entorno de computación en la nube". Computer Physics Communications . 185 (5): 1355–1363. arXiv : 2105.09512 . Código Bibliográfico :2014CoPhC.185.1355C. doi :10.1016/j.cpc.2014.01.006. S2CID  32376269.
  6. ^ Lin, Y.; Wang, F.; Liu, B. (2018). "Generadores de números aleatorios para simulaciones de Monte Carlo paralelas a gran escala en FPGA". Journal of Computational Physics . 360 : 93–103. Bibcode :2018JCoPh.360...93L. doi :10.1016/j.jcp.2018.01.029.
  7. ^ ab Goodman, Leo (1960). "Sobre la varianza exacta de los productos". Revista de la Asociación Estadounidense de Estadística . 55 (292): 708–713. doi :10.2307/2281592. JSTOR  2281592.
  8. ^ Ochoa1, Benjamin; Belongie, Serge "Propagación de covarianza para emparejamiento guiado" Archivado el 20 de julio de 2011 en Wayback Machine.
  9. ^ Ku, HH (octubre de 1966). «Notas sobre el uso de fórmulas de propagación de errores». Journal of Research of the National Bureau of Standards . 70C (4): 262. doi : 10.6028/jres.070c.025 . ISSN  0022-4316 . Consultado el 3 de octubre de 2012 .
  10. ^ Clifford, AA (1973). Análisis de errores multivariados: un manual de propagación y cálculo de errores en sistemas de muchos parámetros . John Wiley & Sons. ISBN 978-0470160558.[ página necesaria ]
  11. ^ Soch, Joram (7 de julio de 2020). "Varianza de la combinación lineal de dos variables aleatorias". El libro de las demostraciones estadísticas . Consultado el 29 de enero de 2022 .
  12. ^ Lee, SH; Chen, W. (2009). "Un estudio comparativo de métodos de propagación de incertidumbre para problemas de tipo caja negra". Optimización estructural y multidisciplinaria . 37 (3): 239–253. doi :10.1007/s00158-008-0234-7. S2CID  119988015.
  13. ^ Johnson, Norman L.; Kotz, Samuel; Balakrishnan, Narayanaswamy (1994). Distribuciones univariadas continuas, volumen 1. Wiley. pág. 171. ISBN 0-471-58495-9.
  14. ^ Lecomte, Christophe (mayo de 2013). "Estadísticas exactas de sistemas con incertidumbres: una teoría analítica de sistemas dinámicos estocásticos de rango uno". Journal of Sound and Vibration . 332 (11): 2750–2776. doi :10.1016/j.jsv.2012.12.009.
  15. ^ "Resumen de la propagación de errores" (PDF) . p. 2. Archivado desde el original (PDF) el 2016-12-13 . Consultado el 2016-04-04 .
  16. ^ "Propagación de la incertidumbre mediante operaciones matemáticas" (PDF) . p. 5 . Consultado el 4 de abril de 2016 .
  17. ^ "Estrategias para la estimación de la varianza" (PDF) . p. 37. Consultado el 18 de enero de 2013 .
  18. ^ ab Harris, Daniel C. (2003), Análisis químico cuantitativo (6.ª ed.), Macmillan, pág. 56, ISBN 978-0-7167-4464-1
  19. ^ "Tutorial de propagación de errores" (PDF) . Foothill College . 9 de octubre de 2009. Consultado el 1 de marzo de 2012 .

Lectura adicional

Enlaces externos