El diseño experimental bayesiano proporciona un marco teórico de probabilidad general del cual se pueden derivar otras teorías sobre el diseño experimental . Se basa en la inferencia bayesiana para interpretar las observaciones/datos adquiridos durante el experimento. Esto permite tener en cuenta tanto cualquier conocimiento previo sobre los parámetros a determinar como las incertidumbres en las observaciones.
La teoría del diseño experimental bayesiano se basa hasta cierto punto en la teoría para la toma de decisiones óptimas en condiciones de incertidumbre . El objetivo al diseñar un experimento es maximizar la utilidad esperada del resultado del experimento. La utilidad se define más comúnmente en términos de una medida de la precisión de la información proporcionada por el experimento (por ejemplo, la información de Shannon o el negativo de la varianza ), pero también puede involucrar factores como el costo financiero de realizar el experimento. Cuál será el diseño óptimo del experimento depende del criterio de utilidad particular elegido.
Si el modelo es lineal, la función de densidad de probabilidad previa (PDF) es homogénea y los errores de observación se distribuyen normalmente , la teoría se simplifica a la teoría clásica del diseño experimental óptimo .
En numerosas publicaciones sobre diseño experimental bayesiano, se supone (a menudo implícitamente) que todas las probabilidades posteriores serán aproximadamente normales. Esto permite calcular la utilidad esperada utilizando la teoría lineal, promediando el espacio de los parámetros del modelo. [1] Sin embargo, se debe tener precaución al aplicar este método, ya que la normalidad aproximada de todos los posteriores posibles es difícil de verificar, incluso en casos de errores de observación normales y probabilidad previa uniforme.
En muchos casos, la distribución posterior no está disponible en forma cerrada y debe aproximarse mediante métodos numéricos. El enfoque más común es utilizar métodos Monte Carlo de cadena de Markov para generar muestras a partir de la parte posterior, que luego se pueden utilizar para aproximar la utilidad esperada.
Otro enfoque es utilizar una aproximación variacional de Bayes de la parte posterior, que a menudo se puede calcular de forma cerrada. Este enfoque tiene la ventaja de ser computacionalmente más eficiente que los métodos de Monte Carlo, pero la desventaja de que la aproximación puede no ser muy precisa.
Algunos autores propusieron enfoques que utilizan la distribución predictiva posterior para evaluar el efecto de nuevas mediciones sobre la incertidumbre de la predicción, [2] [3] mientras que otros sugieren maximizar la información mutua entre parámetros, predicciones y nuevos experimentos potenciales. [4]
Dado un vector de parámetros a determinar, una probabilidad previa sobre esos parámetros y una probabilidad de realizar observaciones , dados los valores de los parámetros y un diseño de experimento , la probabilidad posterior se puede calcular utilizando el teorema de Bayes.
¿Dónde está la densidad de probabilidad marginal en el espacio de observación?
Entonces se puede definir la utilidad esperada de un experimento con diseño.
donde es algún funcional de valor real de la probabilidad posterior después de realizar una observación utilizando un diseño de experimento .
La utilidad puede definirse como la ganancia anterior-posterior en información de Shannon.
Otra posibilidad es definir la utilidad como
la divergencia Kullback-Leibler de la distribución anterior de la posterior. Lindley (1956) señaló que la utilidad esperada será entonces independiente de las coordenadas y puede escribirse de dos formas
de los cuales este último puede evaluarse sin necesidad de evaluar la probabilidad posterior individual para todas las observaciones posibles . [5] Vale la pena señalar que el segundo término en la segunda línea de la ecuación no dependerá del diseño , siempre y cuando la incertidumbre observacional no dependa. Por otro lado, la integral de en la primera forma es constante para todos , por lo que si el objetivo es elegir el diseño con la mayor utilidad, no es necesario calcular el término en absoluto. Varios autores han considerado técnicas numéricas para evaluar y optimizar este criterio. [6] [7] Tenga en cuenta que
siendo la ganancia de información esperada exactamente la información mutua entre el parámetro θ y la observación y . En Bania (2019) se ofrece un ejemplo de diseño bayesiano para la discriminación de modelos dinámicos lineales. [8] Dado que era difícil de calcular, su límite inferior se ha utilizado como función de utilidad. Luego, el límite inferior se maximiza bajo la restricción de energía de la señal. El diseño bayesiano propuesto también se ha comparado con el diseño D-óptimo promedio clásico. Se demostró que el diseño bayesiano es superior al diseño D-óptimo.
El criterio de Kelly también describe dicha función de utilidad para un jugador que busca maximizar las ganancias, que se utiliza en el juego y en la teoría de la información ; La situación de Kelly es idéntica a la anterior, con la información adicional o "cable privado" tomando el lugar del experimento.