stringtranslate.com

Valor esperado de la información de la muestra

En la teoría de la decisión , el valor esperado de la información de la muestra ( EVSI ) es el aumento esperado en la utilidad que un tomador de decisiones podría obtener al obtener acceso a una muestra de observaciones adicionales antes de tomar una decisión. La información adicional obtenida de la muestra puede permitirles tomar una decisión más informada y, por lo tanto, mejor, lo que resulta en un aumento en la utilidad esperada. EVSI intenta estimar cuál sería esta mejora antes de ver los datos de la muestra real; por lo tanto, EVSI es una forma de lo que se conoce como análisis preposterior . El uso de EVSI en la teoría de la decisión fue popularizado por Robert Schlaifer y Howard Raiffa en la década de 1960. [1]

Formulación

Dejar

Es común (pero no esencial) en los escenarios EVSI que , y , es decir, cada observación es una lectura imparcial del sensor del estado subyacente , y cada lectura del sensor es independiente y está distribuida de manera idéntica.

La utilidad de la decisión óptima basada únicamente en la anterior, sin realizar ninguna observación adicional, viene dada por

Si el tomador de decisiones pudiera tener acceso a una única muestra, la utilidad posterior óptima sería

donde se obtiene de la regla de Bayes :

Como no saben qué muestra se obtendría realmente si se obtuviera una, deben promediar todas las muestras posibles para obtener la utilidad esperada dada una muestra:

El valor esperado de la información de la muestra se define entonces como

Cálculo

Es raramente factible llevar a cabo la integración sobre el espacio de posibles observaciones en E[U|SI] analíticamente, por lo que el cálculo de EVSI generalmente requiere una simulación de Monte Carlo . El método implica simular aleatoriamente una muestra, , luego usarla para calcular la utilidad posterior y maximizarla con base en . Todo este proceso luego se repite muchas veces, para obtener una muestra de Monte Carlo de utilidades óptimas. Estas se promedian para obtener la utilidad esperada dada una muestra hipotética.

Ejemplo

Una agencia reguladora debe decidir si aprueba o no un nuevo tratamiento. Antes de tomar la decisión final de aprobarlo o rechazarlo, se pregunta cuál sería el valor de realizar un estudio de prueba adicional en sujetos. El EVSI responde a esta pregunta.

Diagrama del modelo EVSI

El diagrama muestra un diagrama de influencia para calcular el EVSI en este ejemplo.

El modelo clasifica el resultado de cualquier sujeto determinado en una de cinco categorías:

{"Cura", "Mejora", "Ineficaz", "Efecto secundario leve", "Efecto secundario grave"}

Y para cada uno de estos resultados, asigna una utilidad igual a un valor monetario estimado equivalente para el paciente del resultado.

Un estado de decisión, en este ejemplo, es un vector de cinco números entre 0 y 1 que suman 1, lo que indica la proporción de futuros pacientes que experimentarán cada uno de los cinco resultados posibles. Por ejemplo, un estado denota el caso en el que el 5 % de los pacientes se curan, el 60 % mejoran, el 20 % considera que el tratamiento no es eficaz, el 10 % experimenta efectos secundarios leves y el 5 % experimenta efectos secundarios peligrosos.

La distribución a priori se codifica utilizando una distribución de Dirichlet , que requiere cinco números (que no sumen 1) cuyos valores relativos capturan la proporción relativa esperada de cada resultado, y cuya suma codifica la fuerza de esta creencia a priori. En el diagrama, los parámetros de la distribución de Dirichlet están contenidos en la variable alfa de Dirichlet a priori , mientras que la distribución a priori en sí está en la variable de probabilidad a priori . El gráfico de densidad de probabilidad de las marginales se muestra aquí:

En la variable de probabilidad Trial data , los datos de prueba se simulan como una muestra de Monte Carlo de una distribución multinomial . Por ejemplo, cuando Trial_size=100, cada muestra de Monte Carlo de Trial_data contiene un vector que suma 100 y muestra la cantidad de sujetos en el estudio simulado que experimentaron cada uno de los cinco resultados posibles. La siguiente tabla de resultados muestra los primeros 8 resultados de prueba simulados:

Para combinar los datos de este ensayo con una distribución a priori de Dirichlet, solo es necesario sumar las frecuencias de los resultados a los valores alfa de la distribución a priori de Dirichlet, lo que da como resultado una distribución a posteriori de Dirichlet para cada ensayo simulado. Para cada uno de ellos, la decisión de aprobar se toma en función de si la utilidad media es positiva y, utilizando una utilidad de cero cuando el tratamiento no se aprueba, se obtiene la utilidad preposterior . Al repetir el cálculo para un rango de posibles tamaños de ensayo, se obtiene un EVSI para cada posible tamaño de ensayo candidato, como se muestra en este gráfico:

Comparación con medidas relacionadas

El valor esperado de la información de la muestra (EVSI) es una relajación de la métrica del valor esperado de la información perfecta (EVPI), que codifica el aumento de la utilidad que se obtendría si se conociera el verdadero estado subyacente. En esencia, el EVPI indica el valor de la información perfecta, mientras que el EVSI indica el valor de cierta información limitada e incompleta .

El valor esperado de incluir incertidumbre (EVIU) compara el valor de modelar información incierta en comparación con modelar una situación sin tener en cuenta la incertidumbre. Dado que el impacto de la incertidumbre en los resultados calculados a menudo se analiza utilizando métodos de Monte Carlo , EVIU parece ser muy similar al valor de realizar un análisis utilizando una muestra de Monte Carlo , que se asemeja mucho en su enunciado a la noción capturada con EVSI. Sin embargo, EVSI y EVIU son bastante distintos: una diferencia notable entre la forma en que EVSI utiliza la actualización bayesiana para incorporar la muestra simulada.

Véase también

Referencias

  1. ^ Schlaifer, R.; Raiffa, H. (1968). Teoría de la decisión estadística aplicada . Cambridge: MIT Press. OCLC  443816.

Lectura adicional