El diseño experimental bayesiano proporciona un marco teórico de probabilidad general del que se pueden derivar otras teorías sobre el diseño experimental . Se basa en la inferencia bayesiana para interpretar las observaciones/datos adquiridos durante el experimento. Esto permite tener en cuenta tanto cualquier conocimiento previo sobre los parámetros que se van a determinar como las incertidumbres en las observaciones.
La teoría del diseño experimental bayesiano [1] se basa hasta cierto punto en la teoría de la toma de decisiones óptimas en condiciones de incertidumbre . El objetivo al diseñar un experimento es maximizar la utilidad esperada del resultado del experimento. La utilidad se define más comúnmente en términos de una medida de la precisión de la información proporcionada por el experimento (por ejemplo, la información de Shannon o el negativo de la varianza ), pero también puede involucrar factores como el costo financiero de realizar el experimento. Cuál será el diseño óptimo del experimento depende del criterio de utilidad particular elegido.
Si el modelo es lineal, la función de densidad de probabilidad previa (PDF) es homogénea y los errores de observación se distribuyen normalmente , la teoría se simplifica a la teoría clásica del diseño experimental óptimo .
En numerosas publicaciones sobre diseño experimental bayesiano, se supone (a menudo de manera implícita) que todas las probabilidades a posteriori serán aproximadamente normales. Esto permite calcular la utilidad esperada utilizando la teoría lineal, promediando sobre el espacio de parámetros del modelo. [2] Sin embargo, se debe tener cuidado al aplicar este método, ya que la normalidad aproximada de todas las probabilidades a posteriori posibles es difícil de verificar, incluso en casos de errores de observación normales y probabilidad a posteriori uniforme.
En muchos casos, la distribución posterior no está disponible en forma cerrada y debe aproximarse mediante métodos numéricos. El enfoque más común es utilizar métodos de Monte Carlo de cadena de Markov para generar muestras de la distribución posterior, que luego pueden usarse para aproximar la utilidad esperada.
Otro enfoque consiste en utilizar una aproximación bayesiana variacional de la variable posterior, que a menudo se puede calcular en forma cerrada. Este enfoque tiene la ventaja de ser computacionalmente más eficiente que los métodos de Monte Carlo, pero la desventaja de que la aproximación puede no ser muy precisa.
Algunos autores propusieron enfoques que utilizan la distribución predictiva posterior para evaluar el efecto de nuevas mediciones sobre la incertidumbre de la predicción, [3] [4] mientras que otros sugieren maximizar la información mutua entre parámetros, predicciones y posibles nuevos experimentos. [5]
Dado un vector de parámetros a determinar, una probabilidad previa sobre esos parámetros y una probabilidad de realizar la observación , dados los valores de los parámetros y un diseño de experimento , la probabilidad posterior se puede calcular utilizando el teorema de Bayes.
¿Dónde está la densidad de probabilidad marginal en el espacio de observación?
La utilidad esperada de un experimento con diseño se puede definir entonces
donde es una función de valor real de la probabilidad posterior después de realizar la observación utilizando un diseño experimental .
La utilidad puede definirse como la ganancia anterior-posterior en la información de Shannon.
Otra posibilidad es definir la utilidad como
la divergencia de Kullback-Leibler de la distribución anterior con respecto a la posterior. Lindley (1956) observó que la utilidad esperada será entonces independiente de las coordenadas y puede escribirse de dos formas
de los cuales este último puede evaluarse sin la necesidad de evaluar la probabilidad posterior individual para todas las observaciones posibles . [6] Vale la pena señalar que el segundo término en la segunda línea de ecuación no dependerá del diseño , siempre que la incertidumbre observacional no lo haga. Por otro lado, la integral de en la primera forma es constante para todos , por lo que si el objetivo es elegir el diseño con la mayor utilidad, no es necesario calcular el término en absoluto. Varios autores han considerado técnicas numéricas para evaluar y optimizar este criterio. [7] [8] Nótese que
la ganancia de información esperada es exactamente la información mutua entre el parámetro θ y la observación y . En Bania (2019) se ofrece un ejemplo de diseño bayesiano para la discriminación de modelos dinámicos lineales. [9] Dado que era difícil de calcular, se ha utilizado su límite inferior como función de utilidad. Luego, el límite inferior se maximiza bajo la restricción de energía de la señal. El diseño bayesiano propuesto también se ha comparado con el diseño D-óptimo promedio clásico. Se demostró que el diseño bayesiano es superior al diseño D-óptimo.
El criterio de Kelly también describe una función de utilidad para un jugador que busca maximizar sus ganancias, que se utiliza en la teoría de los juegos de azar y de la información ; la situación de Kelly es idéntica a la anterior, con la información secundaria o "cable privado" tomando el lugar del experimento.