stringtranslate.com

Cuantificación de la incertidumbre

La cuantificación de la incertidumbre ( UQ ) es la ciencia de la caracterización cuantitativa y la estimación de incertidumbres en aplicaciones tanto computacionales como del mundo real. Intenta determinar qué tan probables son ciertos resultados si algunos aspectos del sistema no se conocen exactamente. Un ejemplo sería predecir la aceleración de un cuerpo humano en un choque frontal con otro automóvil: incluso si se conociera exactamente la velocidad, pequeñas diferencias en la fabricación de cada automóvil, cuán apretados se han apretado cada perno, etc. conducirá a resultados diferentes que sólo pueden predecirse en un sentido estadístico.

Muchos problemas de las ciencias naturales y la ingeniería también están plagados de fuentes de incertidumbre. Los experimentos informáticos sobre simulaciones informáticas son el enfoque más común para estudiar problemas de cuantificación de la incertidumbre. [1] [2] [3] [4]

Fuentes

La incertidumbre puede entrar en modelos matemáticos y mediciones experimentales en diversos contextos. Una forma de categorizar las fuentes de incertidumbre es considerar: [5]

Parámetro
Esto proviene de los parámetros del modelo que son entradas al modelo informático (modelo matemático) pero cuyos valores exactos son desconocidos para los experimentadores y no pueden controlarse en experimentos físicos, o cuyos valores no pueden inferirse exactamente mediante métodos estadísticos . Algunos ejemplos de esto son la aceleración local de caída libre en un experimento de caída de objetos, varias propiedades materiales en un análisis de elementos finitos para ingeniería y la incertidumbre multiplicadora en el contexto de la optimización de la política macroeconómica .
Paramétrico
Esto proviene de la variabilidad de las variables de entrada del modelo. Por ejemplo, las dimensiones de una pieza de trabajo en un proceso de fabricación pueden no ser exactamente como se diseñaron e indicaron, lo que causaría variabilidad en su desempeño.
Incertidumbre estructural
También conocido como insuficiencia del modelo, sesgo del modelo o discrepancia del modelo, esto proviene de la falta de conocimiento de la física subyacente en el problema. Depende de la precisión con la que un modelo matemático describa el verdadero sistema para una situación de la vida real, considerando el hecho de que los modelos casi siempre son sólo aproximaciones a la realidad. Un ejemplo es cuando se modela el proceso de caída de un objeto utilizando el modelo de caída libre; el modelo en sí es inexacto ya que siempre existe fricción del aire. En este caso, incluso si no hay ningún parámetro desconocido en el modelo, todavía se espera una discrepancia entre el modelo y la física real.
algorítmico
También conocida como incertidumbre numérica o incertidumbre discreta. Este tipo proviene de errores numéricos y aproximaciones numéricas por implementación del modelo informático. La mayoría de los modelos son demasiado complicados para resolverlos exactamente. Por ejemplo, se puede utilizar el método de elementos finitos o el método de diferencias finitas para aproximar la solución de una ecuación diferencial parcial (que introduce errores numéricos). Otros ejemplos son la integración numérica y el truncamiento de suma infinita, que son aproximaciones necesarias en la implementación numérica.
Experimental
También conocido como error de observación, proviene de la variabilidad de las mediciones experimentales. La incertidumbre experimental es inevitable y se puede notar repitiendo una medición muchas veces usando exactamente la misma configuración para todas las entradas/variables.
Interpolación
Esto se debe a la falta de datos disponibles recopilados a partir de simulaciones de modelos informáticos y/o mediciones experimentales. Para otras configuraciones de entrada que no tienen datos de simulación o mediciones experimentales, se debe interpolar o extrapolar para predecir las respuestas correspondientes.

Aleatorico y epistémico

La incertidumbre a veces se clasifica en dos categorías, [6] [7] que se observa de manera destacada en aplicaciones médicas. [8]

Aleatorico
La incertidumbre aleatoria también se conoce como incertidumbre estocástica y es representativa de incógnitas que difieren cada vez que realizamos el mismo experimento. Por ejemplo, una sola flecha disparada con un arco mecánico que duplica exactamente cada lanzamiento (la misma aceleración, altitud, dirección y velocidad final) no impactará todas en el mismo punto del objetivo debido a vibraciones aleatorias y complicadas del eje de la flecha, el cuyo conocimiento no se puede determinar lo suficiente como para eliminar la dispersión resultante de los puntos de impacto. El argumento aquí está obviamente en la definición de "no puedo". El hecho de que no podamos medir lo suficiente con nuestros dispositivos de medición actualmente disponibles no excluye necesariamente la existencia de dicha información, lo que trasladaría esta incertidumbre a la siguiente categoría. Aleatoric se deriva del latín alea o dados, en referencia a un juego de azar.
Incertidumbre epistémica
La incertidumbre epistémica también se conoce como incertidumbre sistemática y se debe a cosas que uno podría saber en principio pero que no conoce en la práctica. Esto puede deberse a que una medición no es precisa, a que el modelo ignora ciertos efectos o a que determinados datos se han ocultado deliberadamente. Un ejemplo de una fuente de esta incertidumbre sería la resistencia en un experimento diseñado para medir la aceleración de la gravedad cerca de la superficie terrestre. La aceleración gravitacional comúnmente utilizada de 9,8 m/s² ignora los efectos de la resistencia del aire, pero la resistencia del aire para el objeto podría medirse e incorporarse al experimento para reducir la incertidumbre resultante en el cálculo de la aceleración gravitacional.
Ocurrencia combinada e interacción de incertidumbre aleatoria y epistémica.
La incertidumbre aleatoria y epistémica también puede ocurrir simultáneamente en un solo término, por ejemplo, cuando los parámetros experimentales muestran incertidumbre aleatoria y esos parámetros experimentales se ingresan en una simulación por computadora. Entonces, si para la cuantificación de la incertidumbre se aprende a partir de experimentos informáticos un modelo sustituto , por ejemplo, un proceso gaussiano o una expansión del caos polinomial , este sustituto exhibe una incertidumbre epistémica que depende o interactúa con la incertidumbre aleatoria de los parámetros experimentales. [4] Tal incertidumbre ya no puede clasificarse únicamente como aleatoria o epistémica, sino que es una incertidumbre inferencial más general.

En aplicaciones de la vida real, ambos tipos de incertidumbres están presentes. La cuantificación de la incertidumbre pretende expresar explícitamente ambos tipos de incertidumbre por separado. La cuantificación de las incertidumbres aleatorias puede ser relativamente sencilla, donde la probabilidad tradicional (frecuentista) es la forma más básica. Con frecuencia se utilizan técnicas como el método de Montecarlo . Una distribución de probabilidad puede representarse por sus momentos (en el caso gaussiano , la media y la covarianza son suficientes, aunque, en general, incluso el conocimiento de todos los momentos hasta un orden arbitrariamente alto todavía no especifica la función de distribución de forma única), o más recientemente, por técnicas como Karhunen-Loève y expansiones de caos polinomiales . Para evaluar las incertidumbres epistémicas, se hacen esfuerzos por comprender el (falta de) conocimiento del sistema, proceso o mecanismo. La incertidumbre epistémica generalmente se entiende a través de la lente de la probabilidad bayesiana , donde las probabilidades se interpretan como una indicación de qué tan segura podría estar una persona racional con respecto a una afirmación específica.

Perspectiva matemática

En matemáticas, la incertidumbre suele caracterizarse en términos de una distribución de probabilidad . Desde esa perspectiva, la incertidumbre epistémica significa no estar seguro de cuál es la distribución de probabilidad relevante, y la incertidumbre aleatoria significa no estar seguro de cuál será una muestra aleatoria extraída de una distribución de probabilidad.

tipos de problemas

Hay dos tipos principales de problemas en la cuantificación de la incertidumbre: uno es la propagación hacia adelante de la incertidumbre (donde las diversas fuentes de incertidumbre se propagan a través del modelo para predecir la incertidumbre general en la respuesta del sistema) y el otro es la evaluación inversa de la incertidumbre del modelo. e incertidumbre de los parámetros (donde los parámetros del modelo se calibran simultáneamente utilizando datos de prueba). Ha habido una proliferación de investigaciones sobre el primer problema y para ello se desarrollaron la mayoría de técnicas de análisis de incertidumbre. Por otro lado, este último problema está atrayendo cada vez más atención en la comunidad de diseño de ingeniería, ya que la cuantificación de la incertidumbre de un modelo y las predicciones posteriores de la(s) respuesta(s) verdadera(s) del sistema son de gran interés en el diseño de sistemas robustos.

Adelante

La propagación de la incertidumbre es la cuantificación de las incertidumbres en las salidas del sistema propagadas a partir de entradas inciertas. Se centra en la influencia sobre los resultados de la variabilidad paramétrica enumerada en las fuentes de incertidumbre. Los objetivos del análisis de propagación de la incertidumbre pueden ser:

Inverso

Dadas algunas mediciones experimentales de un sistema y algunos resultados de simulación por computadora de su modelo matemático, la cuantificación de la incertidumbre inversa estima la discrepancia entre el experimento y el modelo matemático (lo que se llama corrección de sesgo ) y estima los valores de parámetros desconocidos en el modelo si hay son cualquiera (lo que se llama calibración de parámetros o simplemente calibración ). Generalmente éste es un problema mucho más difícil que la propagación directa de la incertidumbre; sin embargo, es de gran importancia ya que normalmente se implementa en un proceso de actualización de modelos. Existen varios escenarios en la cuantificación de la incertidumbre inversa:

El resultado de la corrección del sesgo, incluido un modelo actualizado (media de predicción) y un intervalo de confianza de predicción.

Sólo corrección de sesgo

La corrección de sesgo cuantifica la insuficiencia del modelo , es decir, la discrepancia entre el experimento y el modelo matemático. La fórmula general de actualización del modelo para la corrección del sesgo es:

donde denota las mediciones experimentales en función de varias variables de entrada , denota la respuesta del modelo de computadora (modelo matemático), denota la función de discrepancia aditiva (también conocida como función de sesgo) y denota la incertidumbre experimental. El objetivo es estimar la función de discrepancia y, como subproducto, el modelo actualizado resultante es . Se proporciona un intervalo de confianza de predicción con el modelo actualizado como cuantificación de la incertidumbre.

Sólo calibración de parámetros

La calibración de parámetros estima los valores de uno o más parámetros desconocidos en un modelo matemático. La formulación general de actualización del modelo para la calibración es:

donde denota la respuesta del modelo de computadora que depende de varios parámetros desconocidos del modelo y denota los valores verdaderos de los parámetros desconocidos en el curso de los experimentos. El objetivo es estimar o llegar a una distribución de probabilidad de que abarque el mejor conocimiento de los valores verdaderos de los parámetros.

Corrección de sesgo y calibración de parámetros.

Considera un modelo inexacto con uno o más parámetros desconocidos, y su formulación de actualización del modelo combina los dos:

Es la formulación de actualización de modelos más completa, incluye todas las fuentes posibles de incertidumbre y requiere el mayor esfuerzo para resolverla.

Metodologías selectivas

Se han realizado muchas investigaciones para resolver problemas de cuantificación de la incertidumbre, aunque la mayoría de ellas tratan de la propagación de la incertidumbre. Durante las últimas una o dos décadas, también se han desarrollado una serie de enfoques para problemas de cuantificación de incertidumbre inversa que han demostrado ser útiles para la mayoría de los problemas de pequeña y mediana escala.

Propagación hacia adelante

Los enfoques existentes de propagación de la incertidumbre incluyen enfoques probabilísticos y enfoques no probabilísticos. Básicamente, existen seis categorías de enfoques probabilísticos para la propagación de la incertidumbre: [9]

Para los enfoques no probabilísticos, el análisis de intervalos , [13] la teoría difusa , la teoría de la posibilidad y la teoría de la evidencia se encuentran entre los más utilizados.

El enfoque probabilístico se considera el enfoque más riguroso para el análisis de incertidumbre en el diseño de ingeniería debido a su coherencia con la teoría del análisis de decisiones. Su piedra angular es el cálculo de funciones de densidad de probabilidad para estadísticas de muestreo. [14] Esto se puede realizar rigurosamente para variables aleatorias que se pueden obtener como transformaciones de variables gaussianas, lo que lleva a intervalos de confianza exactos.

Incertidumbre inversa

frecuentista

En el análisis de regresión y los problemas de mínimos cuadrados , el error estándar de las estimaciones de los parámetros está fácilmente disponible, y puede ampliarse a un intervalo de confianza .

bayesiano

Existen varias metodologías para la cuantificación de la incertidumbre inversa bajo el marco bayesiano . La dirección más complicada es apuntar a resolver problemas tanto con la corrección del sesgo como con la calibración de parámetros. Los desafíos de tales problemas incluyen no sólo las influencias de la insuficiencia del modelo y la incertidumbre de los parámetros, sino también la falta de datos tanto de simulaciones por computadora como de experimentos. Una situación común es que la configuración de entrada no sea la misma en experimentos y simulaciones. Otra situación común es que los parámetros derivados de experimentos se ingresan en simulaciones. Para simulaciones computacionalmente costosas, a menudo es necesario un modelo sustituto , por ejemplo, un proceso gaussiano o una expansión del caos polinomial , definiendo un problema inverso para encontrar el modelo sustituto que mejor se aproxime a las simulaciones. [4]

Enfoque modular

Un enfoque para la cuantificación de la incertidumbre inversa es el enfoque bayesiano modular. [5] [15] El enfoque bayesiano modular deriva su nombre de su procedimiento de cuatro módulos. Aparte de los datos disponibles actualmente, se debe asignar una distribución previa de parámetros desconocidos.

Módulo 1: Modelado de procesos gaussianos para el modelo informático

Para abordar el problema de la falta de resultados de simulación, el modelo informático se reemplaza por un modelo de proceso gaussiano (GP).

dónde

es la dimensión de las variables de entrada y es la dimensión de los parámetros desconocidos. Si bien están predefinidos, los hiperparámetros del modelo GP deben estimarse mediante estimación de máxima verosimilitud (MLE) . Este módulo puede considerarse como un método kriging generalizado .

Módulo 2: Modelado de procesos gaussianos para la función de discrepancia

De manera similar con el primer módulo, la función de discrepancia se reemplaza con un modelo GP

dónde

Junto con la distribución previa de parámetros desconocidos y los datos de experimentos y modelos informáticos, se pueden derivar estimaciones de máxima verosimilitud para . Al mismo tiempo, el Módulo 1 también se actualiza.

Módulo 3: Distribución posterior de parámetros desconocidos

Se aplica el teorema de Bayes para calcular la distribución posterior de los parámetros desconocidos:

donde incluye todos los hiperparámetros fijos en módulos anteriores.

Módulo 4: Predicción de la respuesta experimental y función de discrepancia
Enfoque completo

El enfoque completamente bayesiano requiere que se asignen no solo los prioritarios para parámetros desconocidos sino también los prioritarios para los otros hiperparámetros . Sigue los siguientes pasos: [16]

  1. Deducir la distribución posterior ;
  2. Integre y obtenga . Este único paso logra la calibración;
  3. Predicción de la respuesta experimental y función de discrepancia.

Sin embargo, el enfoque tiene importantes inconvenientes:

El enfoque completamente bayesiano requiere una gran cantidad de cálculos y puede que aún no sea práctico para abordar las situaciones de modelado más complicadas. [dieciséis]

Problemas conocidos

Las teorías y metodologías para la propagación de la incertidumbre están mucho mejor establecidas en comparación con la cuantificación inversa de la incertidumbre. En cuanto a este último, quedan varias dificultades sin resolver:

  1. Cuestión de dimensionalidad: El costo computacional aumenta dramáticamente con la dimensionalidad del problema, es decir, el número de variables de entrada y/o el número de parámetros desconocidos.
  2. Problema de identificabilidad: [17] Múltiples combinaciones de parámetros desconocidos y funciones de discrepancia pueden producir la misma predicción experimental. Por lo tanto, no se pueden distinguir/identificar diferentes valores de parámetros. Este problema se evita en un enfoque bayesiano, donde dichas combinaciones se promedian. [4]
  3. Respuesta del modelo incompleta: se refiere a un modelo que no tiene una solución para algunas combinaciones de las variables de entrada. [18] [19]
  4. Cuantificación de la incertidumbre en las cantidades de entrada: Eventos cruciales que faltan en los datos disponibles o cantidades críticas no identificadas por los analistas debido, por ejemplo, a limitaciones en los modelos existentes. [20]
  5. Poca consideración del impacto de las decisiones tomadas por los analistas. [21]

Ver también

Referencias

  1. ^ Sacos, Jerome; Welch, William J.; Mitchell, Toby J.; Wynn, Henry P. (1989). "Diseño y análisis de experimentos informáticos". Ciencia estadística . 4 (4): 409–423. doi : 10.1214/ss/1177012413 . JSTOR  2245858.
  2. ^ Imán, Ronald L.; Helton, Jon C. (1988). "Una investigación de técnicas de análisis de sensibilidad e incertidumbre para modelos informáticos". Análisis de riesgo . 8 (1). Wiley: 71–90. Código Bib : 1988RiesgoA...8...71I. doi :10.1111/j.1539-6924.1988.tb01155.x. ISSN  0272-4332.
  3. ^ Caminante, NOSOTROS; Harremoës, P.; Rotmans, J.; van der Sluijs, JP; van Asselt, MBA; Janssen, P.; Krayer von Krauss, diputado (2003). "Definición de incertidumbre: una base conceptual para la gestión de la incertidumbre en el soporte de decisiones basado en modelos". Evaluación Integrada . 4 (1). Editores Swets & Zeitlinger: 5–17. Código Bib : 2003IntAs...4....5W. doi :10.1076/iaij.4.1.5.16466. hdl : 1874/386032 . ISSN  1389-5176.
  4. ^ abcde Ranftl, Sascha; Von der Linden, Wolfgang (13 de noviembre de 2021). "Análisis sustituto bayesiano y propagación de la incertidumbre". Foro de Ciencias Físicas . 3 (1): 6. arXiv : 2101.04038 . doi : 10.3390/psf2021003006 . ISSN  2673-9984.
  5. ^ ab Kennedy, Marc C.; O'Hagan, Anthony (2001). "Calibración bayesiana de modelos informáticos". Revista de la Royal Statistical Society, Serie B (Metodología estadística) . 63 (3): 425–464. doi : 10.1111/1467-9868.00294 .
  6. ^ Der Kiureghian, Armen; Ditlevsen, Ove (2009). "¿Aleatorio o epistémico? ¿Importa?". Seguridad Estructural . 31 (2): 105-112. doi :10.1016/j.strusafe.2008.06.020.
  7. ^ Matthies, Hermann G. (2007). "Cuantificación de la incertidumbre: representación computacional moderna de probabilidad y aplicaciones". Peligros extremos naturales y provocados por el hombre en la dinámica de estructuras . Serie Seguridad de la OTAN a través de la ciencia. págs. 105-135. doi :10.1007/978-1-4020-5656-7_4. ISBN 978-1-4020-5654-3.
  8. ^ Abhaya Indrayan, Bioestadística médica , segunda edición, Chapman & Hall/CRC Press, 2008, páginas 8, 673
  9. ^ Lee, SH; Chen, W. (9 de mayo de 2008). "Un estudio comparativo de métodos de propagación de la incertidumbre para problemas tipo caja negra". Optimización Estructural y Multidisciplinar . 37 (3). Springer Science y Business Media LLC: 239–253. doi :10.1007/s00158-008-0234-7. ISSN  1615-147X. S2CID  119988015.
  10. ^ Cárdenas, IC (2019). "Sobre el uso de redes bayesianas como enfoque de metamodelado para analizar incertidumbres en el análisis de estabilidad de taludes". Georisk: evaluación y gestión de riesgos para sistemas de ingeniería y geopeligros . 13 (1): 53–65. Código Bib : 2019GAMRE..13...53C. doi :10.1080/17499518.2018.1498524. S2CID  216590427.
  11. ^ Ranftl, Sascha; Melito, Gian Marco; Badeli, Vahid; Reinbacher-Köstinger, Alice; Ellermann, Katrin; von der Linden, Wolfgang (31 de diciembre de 2019). "Cuantificación de la incertidumbre bayesiana con datos de fidelidad múltiple y procesos gaussianos para la cardiografía de impedancia de la disección aórtica". Entropía . 22 (1): 58. Bibcode : 2019Entrp..22...58R. doi : 10.3390/e22010058 . ISSN  1099-4300. PMC 7516489 . PMID  33285833. 
  12. ^ Ranftl, Sascha; Müller, Thomas Stephan; Windberger, Úrsula; von der Linden, Wolfgang; Brenn, Günter (3 de mayo de 2021), Datos y códigos para 'Un enfoque bayesiano de las incertidumbres reológicas de la sangre en la hemodinámica aórtica', doi :10.5281/zenodo.5237189 , consultado el 12 de enero de 2022
  13. ^ Jaulín, L.; Kieffer, M.; Didrit, O.; Walter, E. (2001). Análisis de intervalos aplicado . Saltador. ISBN 1-85233-219-0.
  14. ^ Arnaut, LR Incertidumbre de medición en cámaras de reverberación - I. Estadísticas de muestra. Informe técnico TQE 2, 2º. ed., sec. 3.1, Laboratorio Nacional de Física, 2008.
  15. ^ Marc C. Kennedy, Anthony O'Hagan, Detalles complementarios sobre la calibración bayesiana de modelos informáticos , Sheffield, Universidad de Sheffield: 1–13, 2000
  16. ^ ab Bayarri, MJ ; Berger, JO; Liu, F. (1 de marzo de 2009). "Modularización en análisis bayesiano, con énfasis en análisis de modelos informáticos". Análisis bayesiano . 4 (1). Instituto de Estadística Matemática: 119–150. doi : 10.1214/09-ba404 . ISSN  1936-0975.
  17. ^ Arendt, Paul D.; Apley, Daniel W.; Chen, Wei ; Cordero, David; Gorsich, David (28 de septiembre de 2012). "Mejora de la identificabilidad en la calibración del modelo mediante respuestas múltiples". Revista de diseño mecánico . 134 (10). ASME Internacional: 100909. doi :10.1115/1.4007573. ISSN  1050-0472.
  18. ^ Cárdenas, IC (2019). "Sobre el uso de redes bayesianas como enfoque de metamodelado para analizar incertidumbres en el análisis de estabilidad de taludes". Georisk: evaluación y gestión de riesgos para sistemas de ingeniería y geopeligros . 13 (1): 53–65. Código Bib : 2019GAMRE..13...53C. doi :10.1080/17499518.2018.1498524. S2CID  216590427.
  19. ^ van den Eijnden, AP; Schweckendiek, T; Hicks, MA (2021). "Metamodelado para análisis de confiabilidad geotécnica con modelos ruidosos e incompletos". Georisk: evaluación y gestión de riesgos para sistemas de ingeniería y geopeligros . 16 (3): 518–535. doi : 10.1080/17499518.2021.1952611 . S2CID  238819106.
  20. ^ Cárdenas, I.; Aven, T.; Bandera, R. (2022). "Abordar los desafíos en la cuantificación de la incertidumbre. El caso de las evaluaciones de riesgos geológicos". Geociencias. Desarrollo de modelos. Conversar . 16 (6): 1601-1615. doi : 10.5194/gmd-16-1601-2023 . hdl : 11250/3105739 .
  21. ^ Cárdenas, I.; Aven, T.; Bandera, R. (2022). "Abordar los desafíos en la cuantificación de la incertidumbre. El caso de las evaluaciones de riesgos geológicos". Geociencias. Desarrollo de modelos. Conversar . 16 (6): 1601-1615. doi : 10.5194/gmd-16-1601-2023 . hdl : 11250/3105739 .