El análisis de sensibilidad basado en la varianza (a menudo denominado método de Sobol o índices de Sobol , en honor a Ilya M. Sobol ) es una forma de análisis de sensibilidad global . [1] [2] Trabajando dentro de un marco probabilístico , descompone la varianza de la salida del modelo o sistema en fracciones que pueden atribuirse a las entradas o conjuntos de entradas. Por ejemplo, dado un modelo con dos entradas y una salida, se podría encontrar que el 70% de la varianza de la salida es causada por la varianza en la primera entrada, el 20% por la varianza en la segunda y el 10% debido a las interacciones entre las dos. Estos porcentajes se interpretan directamente como medidas de sensibilidad. Las medidas de sensibilidad basadas en la varianza son atractivas porque miden la sensibilidad en todo el espacio de entrada (es decir, es un método global), pueden tratar respuestas no lineales y pueden medir el efecto de las interacciones en sistemas no aditivos . [3]
Desde una perspectiva de caja negra , cualquier modelo puede verse como una función Y = f ( X ), donde X es un vector de d entradas de modelo inciertas { X 1 , X 2 , ... X d }, e Y es una salida de modelo univariante elegida (tenga en cuenta que este enfoque examina las salidas del modelo escalar, pero se pueden analizar múltiples salidas mediante múltiples análisis de sensibilidad independientes). Además, se supondrá que las entradas se distribuyen de manera independiente y uniforme dentro del hipercubo unitario, es decir, para . Esto no implica ninguna pérdida de generalidad porque cualquier espacio de entrada se puede transformar en este hipercubo unitario. f ( X ) se puede descomponer de la siguiente manera, [4]
donde f 0 es una constante y f i es una función de X i , f ij una función de X i y X j , etc. Una condición de esta descomposición es que,
es decir, todos los términos de la descomposición funcional son ortogonales . Esto conduce a definiciones de los términos de la descomposición funcional en términos de valores esperados condicionales,
De lo cual se desprende que f i es el efecto de variar X i únicamente (conocido como el efecto principal de X i ), y f ij es el efecto de variar X i y X j simultáneamente, adicional al efecto de sus variaciones individuales . Esto se conoce como interacción de segundo orden . Los términos de orden superior tienen definiciones análogas.
Ahora, suponiendo además que f ( X ) es integrable al cuadrado , la descomposición funcional puede elevarse al cuadrado e integrarse para obtener,
Nótese que el lado izquierdo es igual a la varianza de Y , y los términos del lado derecho son términos de varianza, ahora descompuestos con respecto a los conjuntos de X i . Esto finalmente conduce a la expresión de descomposición de la varianza,
dónde
y así sucesivamente. La notación X ~ i indica el conjunto de todas las variables excepto X i . La descomposición de la varianza anterior muestra cómo la varianza de la salida del modelo se puede descomponer en términos atribuibles a cada entrada, así como los efectos de interacción entre ellos. Juntos, todos los términos suman la varianza total de la salida del modelo.
Una medida directa basada en la varianza de la sensibilidad S i , llamada "índice de sensibilidad de primer orden" o "índice de efecto principal", se enuncia de la siguiente manera: [4]
Esta es la contribución a la varianza de salida del efecto principal de X i , por lo tanto, mide el efecto de variar X i solo , pero promediado sobre variaciones en otros parámetros de entrada. Está estandarizado por la varianza total para proporcionar una contribución fraccionaria. Los índices de interacción de orden superior S ij , S ijk y así sucesivamente se pueden formar dividiendo otros términos en la descomposición de la varianza por Var( Y ). Tenga en cuenta que esto tiene la implicación de que,
Utilizando los índices S i , S ij y de orden superior dados anteriormente, se puede construir una imagen de la importancia de cada variable para determinar la varianza de salida. Sin embargo, cuando el número de variables es grande, esto requiere la evaluación de 2 índices d -1, lo que puede ser demasiado exigente computacionalmente. Por esta razón, se utiliza una medida conocida como el "índice de efecto total" o "índice de orden total", S Ti . [5] Esto mide la contribución a la varianza de salida de X i , incluida toda la varianza causada por sus interacciones, de cualquier orden, con cualquier otra variable de entrada. Se da como,
Nótese que a diferencia del S i ,
debido a que el efecto de interacción entre, por ejemplo, X i y X j se tiene en cuenta tanto en S Ti como en S Tj . De hecho, la suma de S Ti solo será igual a 1 cuando el modelo sea puramente aditivo .
En el caso de funciones que se puedan analizar analíticamente, los índices anteriores se pueden calcular de forma analítica evaluando las integrales en la descomposición. Sin embargo, en la gran mayoría de los casos se estiman, lo que se suele hacer mediante el método de Monte Carlo .
El método de Monte Carlo implica generar una secuencia de puntos distribuidos aleatoriamente dentro del hipercubo unitario (en sentido estricto, estos serán pseudoaleatorios ). En la práctica, es común sustituir secuencias aleatorias por secuencias de baja discrepancia para mejorar la eficiencia de los estimadores. Esto se conoce como el método cuasi-Monte Carlo . Algunas secuencias de baja discrepancia que se utilizan comúnmente en el análisis de sensibilidad incluyen la secuencia de Sobol y el diseño de hipercubo latino .
Para calcular los índices mediante el método (cuasi) Monte Carlo se utilizan los siguientes pasos: [1] [2]
La precisión de los estimadores depende, por supuesto, de N. El valor de N se puede elegir añadiendo puntos secuencialmente y calculando los índices hasta que los valores estimados alcancen una convergencia aceptable. Por este motivo, cuando se utilizan secuencias de baja discrepancia, puede resultar ventajoso utilizar aquellas que permiten la adición secuencial de puntos (como la secuencia de Sobol), en comparación con aquellas que no lo hacen (como las secuencias de hipercubos latinos).
Hay varios estimadores de Monte Carlo disponibles para ambos índices. Dos de los que se utilizan actualmente son: [1] [6]
y
para la estimación del S i y del S Ti respectivamente.
Para la estimación de S i y S Ti para todas las variables de entrada, se requieren N ( d +2) ejecuciones del modelo. Dado que N es a menudo del orden de cientos o miles de ejecuciones, el gasto computacional puede convertirse rápidamente en un problema cuando el modelo requiere una cantidad significativa de tiempo para una sola ejecución. En tales casos, hay una serie de técnicas disponibles para reducir el costo computacional de la estimación de índices de sensibilidad, como emuladores , HDMR y FAST .