El caos polinomial (CP) , también llamado expansión del caos polinomial ( ECP ) y expansión del caos de Wiener , es un método para representar una variable aleatoria en términos de una función polinomial de otras variables aleatorias. Los polinomios se eligen para que sean ortogonales con respecto a la distribución de probabilidad conjunta de estas variables aleatorias. Nótese que a pesar de su nombre, la ECP no tiene conexiones inmediatas con la teoría del caos . La palabra "caos" aquí debe entenderse como "aleatorio". [1]
El PCE fue introducido por primera vez en 1938 por Norbert Wiener usando polinomios de Hermite para modelar procesos estocásticos con variables aleatorias gaussianas . [2] Fue introducido a la comunidad de física e ingeniería por R. Ghanem y PD Spanos en 1991 [3] y generalizado a otras familias de polinomios ortogonales por D. Xiu y GE Karniadakis en 2002. [4] OG Ernst y colaboradores dieron pruebas matemáticamente rigurosas de existencia y convergencia del PCE generalizado en 2011. [5]
El PCE se ha utilizado ampliamente en ingeniería y ciencias aplicadas porque permite abordar la incertidumbre probabilística en los parámetros de un sistema. En particular, el PCE se ha utilizado como modelo sustituto para facilitar los análisis de cuantificación de la incertidumbre . [6] [7] El PCE también se ha utilizado ampliamente en el análisis de elementos finitos estocásticos [3] y para determinar la evolución de la incertidumbre en un sistema dinámico cuando existe incertidumbre probabilística en los parámetros del sistema. [8]
La expansión del caos polinomial (PCE) proporciona una forma de representar una variable aleatoria con varianza finita (es decir, ) como una función de un vector aleatorio de dimensión , utilizando una base polinomial que es ortogonal con respecto a la distribución de este vector aleatorio. La PCE prototípica se puede escribir como:
En esta expresión, es un coeficiente y denota una función de base polinómica. Según la distribución de , se distinguen distintos tipos de PCE.
La formulación PCE original utilizada por Norbert Wiener [2] se limitaba al caso donde es un vector aleatorio con una distribución gaussiana. Considerando solo el caso unidimensional (es decir, y ), la función base polinómica ortogonal con respecto a la distribución gaussiana es el conjunto de polinomios de Hermite de grado -ésimo . La PCE de se puede escribir entonces como:
Xiu (en su doctorado bajo la dirección de Karniadakis en la Universidad Brown) generalizó el resultado de Cameron-Martin a varias distribuciones continuas y discretas utilizando polinomios ortogonales del llamado esquema Askey y demostró la convergencia en el espacio funcional de Hilbert correspondiente. Esto se conoce popularmente como el marco de caos polinomial generalizado (gPC). El marco gPC se ha aplicado a aplicaciones que incluyen dinámica de fluidos estocástica , elementos finitos estocásticos, mecánica de sólidos , estimación no lineal, la evaluación de efectos de longitud de palabra finita en sistemas digitales de punto fijo no lineales y control robusto probabilístico . Se ha demostrado que los métodos basados en gPC son computacionalmente superiores a los métodos basados en Monte Carlo en varias aplicaciones. [9] Sin embargo, el método tiene una limitación notable. Para grandes cantidades de variables aleatorias, el caos polinomial se vuelve muy costoso computacionalmente y los métodos de Monte Carlo suelen ser más factibles. [10]
Recientemente, la expansión del caos recibió una generalización hacia la expansión del caos polinomial arbitraria (aPC), [11] que es una llamada generalización basada en datos de la PC. Como todas las técnicas de expansión del caos polinomial, aPC aproxima la dependencia de la salida del modelo de simulación en los parámetros del modelo mediante la expansión en una base polinomial ortogonal. La aPC generaliza las técnicas de expansión del caos hacia distribuciones arbitrarias con medidas de probabilidad arbitrarias, que pueden ser discretas, continuas o continuas discretizadas y pueden especificarse analíticamente (como funciones de distribución acumulativa/densidad de probabilidad), numéricamente como histograma o como conjuntos de datos sin procesar. La aPC en el orden de expansión finito solo exige la existencia de un número finito de momentos y no requiere el conocimiento completo o incluso la existencia de una función de densidad de probabilidad. Esto evita la necesidad de asignar distribuciones de probabilidad paramétricas que no están suficientemente respaldadas por los datos disponibles limitados. Alternativamente, permite a los modeladores elegir libremente, entre las restricciones técnicas, las formas de sus supuestos estadísticos. Las investigaciones indican que el aPC muestra una tasa de convergencia exponencial y converge más rápido que las técnicas clásicas de expansión del caos polinomial [ cita requerida ] . Aunque estas técnicas están en desarrollo, su impacto en los modelos de dinámica de fluidos computacional (CFD) es bastante impresionante.
En muchas situaciones prácticas, sólo se dispone de conocimientos estadísticos incompletos e imprecisos sobre parámetros de entrada inciertos. Afortunadamente, para construir una expansión de orden finito, sólo se requiere cierta información parcial sobre la medida de probabilidad que se puede representar de forma sencilla mediante un número finito de momentos estadísticos. Cualquier orden de expansión sólo se justifica si va acompañado de información estadística fiable sobre los datos de entrada. Por tanto, la información estadística incompleta limita la utilidad de las expansiones caóticas polinómicas de orden superior. [12]
El caos polinomial puede utilizarse en la predicción de funcionales no lineales de procesos de incremento estacionario gaussiano condicionados a sus realizaciones pasadas. [13] Específicamente, dicha predicción se obtiene derivando la expansión del caos del funcional con respecto a una base especial para el espacio de Hilbert gaussiano generado por el proceso que tiene la propiedad de que cada elemento de base es medible o independiente con respecto a las muestras dadas. Por ejemplo, este enfoque conduce a una fórmula de predicción fácil para el movimiento browniano fraccionario .
En un entorno no intrusivo, la estimación de los coeficientes de expansión para un conjunto dado de funciones base puede considerarse como un problema de regresión bayesiana mediante la construcción de un modelo sustituto . Este enfoque tiene beneficios en el sentido de que están disponibles expresiones analíticas para la evidencia de los datos (en el sentido de inferencia bayesiana ), así como la incertidumbre de los coeficientes de expansión. [14] La evidencia puede usarse entonces como una medida para la selección de términos de expansión y la poda de las series (véase también comparación de modelos bayesianos ). La incertidumbre de los coeficientes de expansión puede usarse para evaluar la calidad y confiabilidad del PCE, y además el impacto de esta evaluación en la cantidad real de interés .
Sea un conjunto de pares de datos de entrada-salida que se utiliza para estimar los coeficientes de expansión . Sea la matriz de datos con elementos , sea el conjunto de datos de salida escritos en forma vectorial y sea el conjunto de coeficientes de expansión en forma vectorial. Suponiendo que la incertidumbre del PCE es de tipo gaussiano con varianza desconocida y una distribución previa invariante en escala , el valor esperado para los coeficientes de expansión es
Con , entonces la covarianza de los coeficientes es [14]
donde es el desajuste mínimo y es la matriz identidad. La incertidumbre de la estimación del coeficiente se da entonces por . Por lo tanto, la incertidumbre de la estimación de los coeficientes de expansión se puede obtener con simples multiplicaciones de matriz-vector. Para una función de densidad de probabilidad de entrada dada , se demostró que el segundo momento para la cantidad de interés es simplemente [14]
Esta ecuación suma las multiplicaciones matriz-vector anteriores más la marginalización con respecto a . El primer término determina la incertidumbre primaria de la cantidad de interés , obtenida con base en el PCE usado como sustituto. El segundo término constituye una incertidumbre inferencial adicional (a menudo de tipo aleatorio-epistémico mixto) en la cantidad de interés que se debe a una incertidumbre finita del PCE. [14] Si hay suficientes datos disponibles, en términos de calidad y cantidad, se puede demostrar que se vuelve despreciablemente pequeño y se vuelve pequeño [14] Esto se puede juzgar simplemente construyendo las razones de los dos términos, por ejemplo . Esta razón cuantifica la cantidad de la propia incertidumbre del PCE en la incertidumbre total y está en el intervalo . Por ejemplo, si , entonces la mitad de la incertidumbre proviene del propio PCE, y se pueden tomar acciones para mejorar el PCE o recopilar más datos. Si , entonces la incertidumbre del PCE es baja y el PCE puede considerarse confiable.
En una selección de modelo sustituto bayesiano, la probabilidad de un modelo sustituto particular, es decir, un conjunto particular de coeficientes de expansión y funciones base , está dada por la evidencia de los datos ,
donde es la función gamma , es el determinante de , es el número de datos y es el ángulo sólido en dimensiones, donde es el número de términos en el PCE.
Se pueden aplicar hallazgos análogos al cálculo de índices de sensibilidad basados en PCE . Se pueden obtener resultados similares para Kriging . [14]