stringtranslate.com

Análisis de sensibilidad basado en la varianza

El análisis de sensibilidad basado en la varianza (a menudo denominado método de Sobol o índices de Sobol , en honor a Ilya M. Sobol ) es una forma de análisis de sensibilidad global . [1] [2] Trabajando dentro de un marco probabilístico , descompone la varianza de la salida del modelo o sistema en fracciones que pueden atribuirse a las entradas o conjuntos de entradas. Por ejemplo, dado un modelo con dos entradas y una salida, se podría encontrar que el 70% de la varianza de la salida es causada por la varianza en la primera entrada, el 20% por la varianza en la segunda y el 10% debido a las interacciones entre las dos. Estos porcentajes se interpretan directamente como medidas de sensibilidad. Las medidas de sensibilidad basadas en la varianza son atractivas porque miden la sensibilidad en todo el espacio de entrada (es decir, es un método global), pueden tratar respuestas no lineales y pueden medir el efecto de las interacciones en sistemas no aditivos . [3]

Descomposición de la varianza

Desde una perspectiva de caja negra , cualquier modelo puede verse como una función Y = f ( X ), donde X es un vector de d entradas de modelo inciertas { X 1 , X 2 , ... X d }, e Y es una salida de modelo univariante elegida (tenga en cuenta que este enfoque examina las salidas del modelo escalar, pero se pueden analizar múltiples salidas mediante múltiples análisis de sensibilidad independientes). Además, se supondrá que las entradas se distribuyen de manera independiente y uniforme dentro del hipercubo unitario, es decir, para . Esto no implica ninguna pérdida de generalidad porque cualquier espacio de entrada se puede transformar en este hipercubo unitario. f ( X ) se puede descomponer de la siguiente manera, [4]

donde f 0 es una constante y f i es una función de X i , f ij una función de X i y X j , etc. Una condición de esta descomposición es que,

es decir, todos los términos de la descomposición funcional son ortogonales . Esto conduce a definiciones de los términos de la descomposición funcional en términos de valores esperados condicionales,

De lo cual se desprende que f i es el efecto de variar X i únicamente (conocido como el efecto principal de X i ), y f ij es el efecto de variar X i y X j simultáneamente, adicional al efecto de sus variaciones individuales . Esto se conoce como interacción de segundo orden . Los términos de orden superior tienen definiciones análogas.

Ahora, suponiendo además que f ( X ) es integrable al cuadrado , la descomposición funcional puede elevarse al cuadrado e integrarse para obtener,

Nótese que el lado izquierdo es igual a la varianza de Y , y los términos del lado derecho son términos de varianza, ahora descompuestos con respecto a los conjuntos de X i . Esto finalmente conduce a la expresión de descomposición de la varianza,

dónde

,

y así sucesivamente. La notación X ~ i indica el conjunto de todas las variables excepto X i . La descomposición de la varianza anterior muestra cómo la varianza de la salida del modelo se puede descomponer en términos atribuibles a cada entrada, así como los efectos de interacción entre ellos. Juntos, todos los términos suman la varianza total de la salida del modelo.

Índices de primer orden

Una medida directa basada en la varianza de la sensibilidad S i , llamada "índice de sensibilidad de primer orden" o "índice de efecto principal", se enuncia de la siguiente manera: [4]

Esta es la contribución a la varianza de salida del efecto principal de X i , por lo tanto, mide el efecto de variar X i solo , pero promediado sobre variaciones en otros parámetros de entrada. Está estandarizado por la varianza total para proporcionar una contribución fraccionaria. Los índices de interacción de orden superior S ij , S ijk y así sucesivamente se pueden formar dividiendo otros términos en la descomposición de la varianza por Var( Y ). Tenga en cuenta que esto tiene la implicación de que,

Índice de efecto total

Utilizando los índices S i , S ij y de orden superior dados anteriormente, se puede construir una imagen de la importancia de cada variable para determinar la varianza de salida. Sin embargo, cuando el número de variables es grande, esto requiere la evaluación de 2 índices d -1, lo que puede ser demasiado exigente computacionalmente. Por esta razón, se utiliza una medida conocida como el "índice de efecto total" o "índice de orden total", S Ti . [5] Esto mide la contribución a la varianza de salida de X i , incluida toda la varianza causada por sus interacciones, de cualquier orden, con cualquier otra variable de entrada. Se da como,

Nótese que a diferencia del S i ,

debido a que el efecto de interacción entre, por ejemplo, X i y X j se tiene en cuenta tanto en S Ti como en S Tj . De hecho, la suma de S Ti solo será igual a 1 cuando el modelo sea puramente aditivo .

Cálculo de índices

En el caso de funciones que se puedan analizar analíticamente, los índices anteriores se pueden calcular de forma analítica evaluando las integrales en la descomposición. Sin embargo, en la gran mayoría de los casos se estiman, lo que se suele hacer mediante el método de Monte Carlo .

Secuencias de muestreo

Un ejemplo de construcción de matrices A B i con d = 3 y N = 4.

El método de Monte Carlo implica generar una secuencia de puntos distribuidos aleatoriamente dentro del hipercubo unitario (en sentido estricto, estos serán pseudoaleatorios ). En la práctica, es común sustituir secuencias aleatorias por secuencias de baja discrepancia para mejorar la eficiencia de los estimadores. Esto se conoce como el método cuasi-Monte Carlo . Algunas secuencias de baja discrepancia que se utilizan comúnmente en el análisis de sensibilidad incluyen la secuencia de Sobol y el diseño de hipercubo latino .

Procedimiento

Para calcular los índices mediante el método (cuasi) Monte Carlo se utilizan los siguientes pasos: [1] [2]

  1. Generar una matriz de muestra N × 2 d , es decir, cada fila es un punto de muestra en el hiperespacio de 2 dimensiones d . Esto debe hacerse con respecto a las distribuciones de probabilidad de las variables de entrada.
  2. Utilice las primeras d columnas de la matriz como matriz A y las d columnas restantes como matriz B. Esto proporciona efectivamente dos muestras independientes de N puntos en el hipercubo unitario de dimensión d .
  3. Construya otras N × d matrices A B i , para i = 1,2,...,d, tales que la i ésima columna de A B i sea igual a la i ésima columna de B , y las columnas restantes sean de A .
  4. Las matrices A , B y d A B i en total especifican N ( d +2) puntos en el espacio de entrada (uno para cada fila). Ejecute el modelo en cada punto de diseño en las matrices A , B y A B i , lo que da un total de N ( d +2) evaluaciones del modelo: los valores f( A ), f( B ) y f( A B i correspondientes .
  5. Calcule los índices de sensibilidad utilizando los estimadores siguientes.

La precisión de los estimadores depende, por supuesto, de N. El valor de N se puede elegir añadiendo puntos secuencialmente y calculando los índices hasta que los valores estimados alcancen una convergencia aceptable. Por este motivo, cuando se utilizan secuencias de baja discrepancia, puede resultar ventajoso utilizar aquellas que permiten la adición secuencial de puntos (como la secuencia de Sobol), en comparación con aquellas que no lo hacen (como las secuencias de hipercubos latinos).

Estimadores

Hay varios estimadores de Monte Carlo disponibles para ambos índices. Dos de los que se utilizan actualmente son: [1] [6]

y

para la estimación del S i y del S Ti respectivamente.

Gastos computacionales

Para la estimación de S i y S Ti para todas las variables de entrada, se requieren N ( d +2) ejecuciones del modelo. Dado que N es a menudo del orden de cientos o miles de ejecuciones, el gasto computacional puede convertirse rápidamente en un problema cuando el modelo requiere una cantidad significativa de tiempo para una sola ejecución. En tales casos, hay una serie de técnicas disponibles para reducir el costo computacional de la estimación de índices de sensibilidad, como emuladores , HDMR y FAST .

Véase también

Referencias

  1. ^ abc Sobol, IM (2001), Índices de sensibilidad global para modelos matemáticos no lineales y sus estimaciones de Monte Carlo. MATH COMPUT SIMULAT , 55(1–3), 271-280, doi : 10.1016/S0378-4754(00)00270-6
  2. ^ ab Saltelli, A., Ratto, M., Andrés, T., Campolongo, F., Cariboni, J., Gatelli, D. Saisana, M. y Tarantola, S., 2008, Análisis de sensibilidad global. La cartilla , John Wiley & Sons.
  3. ^ Saltelli, A., Annoni, P., 2010, Cómo evitar un análisis de sensibilidad superficial, Environmental Modeling and Software 25 , 1508–1517.
  4. ^ ab Sobol', I. (1990). Estimaciones de sensibilidad para modelos matemáticos no lineales. Matematicheskoe Modelirovanie 2 , 112–118. en ruso, traducido al inglés en Sobol', I. (1993). Análisis de sensibilidad para modelos matemáticos no lineales. Modelado matemático y experimento computacional (traducción al inglés) , 1993, 1 , 407–414.
  5. ^ Homma, T. y A. Saltelli (1996). Medidas de importancia en el análisis de sensibilidad global de modelos no lineales. Ingeniería de confiabilidad y seguridad de sistemas , 52 , 1–17.
  6. ^ Andrea Saltelli, Paola Annoni, Ivano Azzini, Francesca Campolongo, Marco Ratto y Stefano Tarantola. Análisis de sensibilidad basado en varianza de la salida del modelo. Diseño y estimador del índice de sensibilidad total. Comunicaciones de física informática , 181 (2): 259 {270, 2010