Experimento informático

Un experimento informático o experimento de simulación es un experimento que se utiliza para estudiar una simulación informática, también denominada sistema in silico . Esta área incluye la física computacional , la química computacional , la biología computacional y otras disciplinas similares.

Fondo

Las simulaciones por computadora se construyen para emular un sistema físico. Debido a que su propósito es replicar algún aspecto de un sistema en detalle, a menudo no producen una solución analítica. Por lo tanto, se utilizan métodos como la simulación de eventos discretos o los solucionadores de elementos finitos . Se utiliza un modelo de computadora para hacer inferencias sobre el sistema que replica. Por ejemplo, los modelos climáticos se utilizan a menudo porque la experimentación en un objeto del tamaño de la Tierra es imposible.

Objetivos

Los experimentos informáticos se han empleado con muchos fines. Algunos de ellos son:

Cuantificación de la incertidumbre : caracterizar la incertidumbre presente en una simulación por computadora que surge de incógnitas durante la construcción de la simulación por computadora.
Problemas inversos : descubrir las propiedades subyacentes del sistema a partir de los datos físicos.
Corrección de sesgo: utilice datos físicos para corregir el sesgo en la simulación.
Asimilación de datos : combine múltiples simulaciones y fuentes de datos físicos en un modelo predictivo completo.
Diseño de sistemas : encontrar entradas que resulten en medidas óptimas de rendimiento del sistema.

Modelado de simulación por computadora

El modelado de experimentos informáticos suele utilizar un marco bayesiano. La estadística bayesiana es una interpretación del campo de la estadística en la que toda la evidencia sobre el verdadero estado del mundo se expresa explícitamente en forma de probabilidades . En el ámbito de los experimentos informáticos, la interpretación bayesiana implicaría que debemos formar una distribución previa que represente nuestra creencia previa sobre la estructura del modelo informático. El uso de esta filosofía para experimentos informáticos comenzó en la década de 1980 y está muy bien resumido por Sacks et al. (1989) [1]. Si bien el enfoque bayesiano se utiliza ampliamente, recientemente se han discutido los enfoques frecuentistas [2].

La idea básica de este marco es modelar la simulación por computadora como una función desconocida de un conjunto de entradas. La simulación por computadora se implementa como un fragmento de código de computadora que se puede evaluar para producir una colección de salidas. Ejemplos de entradas para estas simulaciones son los coeficientes en el modelo subyacente, las condiciones iniciales y las funciones de fuerza . Es natural ver la simulación como una función determinista que mapea estas entradas en una colección de salidas . Sobre la base de ver nuestro simulador de esta manera, es común referirse a la colección de entradas como , la simulación por computadora en sí como , y la salida resultante como . Tanto y son cantidades vectoriales, y pueden ser colecciones muy grandes de valores, a menudo indexados por espacio, o por tiempo, o por espacio y tiempo. ${\estilo de visualización x}$ ${\estilo de visualización f}$ ${\estilo de visualización f(x)}$ ${\estilo de visualización x}$ ${\estilo de visualización f(x)}$

Aunque en teoría se sabe, en la práctica no es así. Muchos simuladores comprenden decenas de miles de líneas de código informático de alto nivel, que no son accesibles a la intuición. En el caso de algunas simulaciones, como los modelos climáticos, la evaluación de la salida de un único conjunto de entradas puede requerir millones de horas de ordenador [3]. $f(\cdot )$

Proceso gaussiano previo

El modelo típico para la salida de un código informático es un proceso gaussiano. Para simplificar la notación, supongamos que es un escalar. Debido al marco bayesiano, fijamos nuestra creencia de que la función sigue un proceso gaussiano , donde es la función media y es la función de covarianza. Las funciones medias populares son polinomios de orden bajo y una función de covarianza popular es la covarianza de Matern , que incluye tanto las covarianzas exponencial ( ) como gaussianas (as ). ${\estilo de visualización f(x)}$ ${\estilo de visualización f}$ $f\sim \nombreoperador {GP} (m(\cdot ),C(\cdot ,\cdot )),$ ${\estilo de visualización m}$ ${\estilo de visualización C}$ $\nu = 1/2$ $\nu \rightarrow \infty$

Diseño de experimentos informáticos

El diseño de experimentos informáticos presenta diferencias considerables con respecto al diseño de experimentos para modelos paramétricos. Dado que un proceso gaussiano previo tiene una representación dimensional infinita, no se pueden utilizar los conceptos de criterios A y D (véase Diseño óptimo ), que se centran en reducir el error en los parámetros. Las réplicas también serían un desperdicio en los casos en que la simulación por ordenador no tiene ningún error. Los criterios que se utilizan para determinar un buen diseño experimental incluyen el error de predicción cuadrático medio integrado [4] y los criterios basados en la distancia [5].

Las estrategias populares para el diseño incluyen el muestreo de hipercubo latino y secuencias de baja discrepancia .

Problemas con tamaños de muestra masivos

A diferencia de los experimentos físicos, es común que los experimentos de computadora tengan miles de combinaciones de entrada diferentes. Debido a que la inferencia estándar requiere la inversión matricial de una matriz cuadrada del tamaño del número de muestras ( ), el costo crece en el . La inversión matricial de matrices grandes y densas también puede causar imprecisiones numéricas. Actualmente, este problema se resuelve mediante técnicas de árboles de decisión voraces, lo que permite cálculos efectivos para dimensionalidad y tamaño de muestra ilimitados patente WO2013055257A1, o se evita mediante el uso de métodos de aproximación, por ejemplo [6]. ${\estilo de visualización n}$ ${\mathcal {O}}(n^{3})$

Véase también

Lectura adicional

Santner, Thomas (2003). El diseño y análisis de experimentos informáticos . Berlín: Springer. ISBN 0-387-95420-1.

Fehr, Jörg; Heiland, Jan; Himpe, Christian; Saak, Jens (2016). "Mejores prácticas para replicabilidad, reproducibilidad y reutilización de experimentos basados en computadora ejemplificados por software de reducción de modelos". Matemáticas AIMS . 1 (3): 261–281. arXiv : 1607.01191 . doi :10.3934/Math.2016.3.261. S2CID 14715031.