Un problema inverso en ciencia es el proceso de calcular a partir de un conjunto de observaciones los factores causales que las produjeron: por ejemplo, calcular una imagen en tomografía computarizada de rayos X , la reconstrucción de la fuente en acústica o calcular la densidad de la Tierra a partir de mediciones de su campo gravitatorio . Se llama problema inverso porque comienza con los efectos y luego calcula las causas. Es el inverso de un problema directo, que comienza con las causas y luego calcula los efectos.
Los problemas inversos son algunos de los problemas matemáticos más importantes en ciencia y matemáticas porque nos informan sobre parámetros que no podemos observar directamente. Tienen una amplia aplicación en identificación de sistemas , óptica , radar , acústica , teoría de la comunicación , procesamiento de señales , imágenes médicas , visión artificial , [1] [2] geofísica , oceanografía , astronomía , teledetección , procesamiento del lenguaje natural , aprendizaje automático , [3] pruebas no destructivas , análisis de estabilidad de taludes [4] y muchos otros campos. [ cita requerida ]
Comenzar por los efectos para descubrir las causas ha preocupado a los físicos durante siglos. Un ejemplo histórico son los cálculos de Adams y Le Verrier que llevaron al descubrimiento de Neptuno a partir de la trayectoria perturbada de Urano . Sin embargo, el estudio formal de los problemas inversos no se inició hasta el siglo XX.
Uno de los primeros ejemplos de una solución a un problema inverso fue descubierto por Hermann Weyl y publicado en 1911, describiendo el comportamiento asintótico de los valores propios del operador de Laplace-Beltrami . [5] Hoy conocida como la ley de Weyl , tal vez se comprenda más fácilmente como una respuesta a la pregunta de si es posible escuchar la forma de un tambor . Weyl conjeturó que las frecuencias propias de un tambor estarían relacionadas con el área y el perímetro del tambor mediante una ecuación particular, un resultado mejorado por matemáticos posteriores.
El campo de los problemas inversos fue abordado posteriormente por el físico soviético - armenio Viktor Ambartsumian . [6] [7]
Siendo aún estudiante, Ambartsumian estudió a fondo la teoría de la estructura atómica, la formación de los niveles de energía y la ecuación de Schrödinger y sus propiedades, y cuando dominó la teoría de los valores propios de las ecuaciones diferenciales , señaló la aparente analogía entre los niveles de energía discretos y los valores propios de las ecuaciones diferenciales. Entonces preguntó: dada una familia de valores propios, ¿es posible encontrar la forma de las ecuaciones cuyos valores propios son? Esencialmente, Ambartsumian estaba examinando el problema inverso de Sturm-Liouville , que trataba de determinar las ecuaciones de una cuerda vibrante. Este artículo fue publicado en 1929 en la revista de física alemana Zeitschrift für Physik y permaneció en la oscuridad durante bastante tiempo. Al describir esta situación después de muchas décadas, Ambartsumian dijo: "Si un astrónomo publica un artículo con contenido matemático en una revista de física, entonces lo más probable es que caiga en el olvido".
Sin embargo, hacia el final de la Segunda Guerra Mundial, este artículo, escrito por Ambartsumian, de 20 años, fue encontrado por matemáticos suecos y formó el punto de partida para toda un área de investigación sobre problemas inversos, convirtiéndose en la base de toda una disciplina.
Después, Gelfand y Levitan, en la Unión Soviética, dedicaron importantes esfuerzos a la "solución directa" del problema de dispersión inversa . [8] Propusieron un método analítico constructivo para determinar la solución. Cuando las computadoras estuvieron disponibles, algunos autores investigaron la posibilidad de aplicar su enfoque a problemas similares, como el problema inverso en la ecuación de onda 1D. Pero rápidamente se demostró que la inversión es un proceso inestable: el ruido y los errores pueden amplificarse enormemente, haciendo que una solución directa sea difícilmente practicable. Luego, alrededor de los años setenta, aparecieron los métodos de mínimos cuadrados y probabilísticos, que resultaron muy útiles para la determinación de parámetros involucrados en varios sistemas físicos. Este enfoque tuvo mucho éxito. Hoy en día, los problemas inversos también se investigan en campos ajenos a la física, como la química, la economía y la informática. Con el tiempo, a medida que los modelos numéricos se vuelvan predominantes en muchas partes de la sociedad, podemos esperar un problema inverso asociado con cada uno de estos modelos numéricos.
Desde Newton, los científicos han intentado extensamente modelar el mundo. En particular, cuando se dispone de un modelo matemático (por ejemplo, la ley de la gravedad de Newton o la ecuación de Coulomb para la electrostática), podemos prever, dados algunos parámetros que describen un sistema físico (como una distribución de masa o una distribución de cargas eléctricas), el comportamiento del sistema. Este enfoque se conoce como modelado matemático y los parámetros físicos mencionados anteriormente se denominan parámetros del modelo o simplemente el modelo . Para ser precisos, introducimos la noción de estado del sistema físico : es la solución de la ecuación del modelo matemático. En la teoría del control óptimo , estas ecuaciones se denominan ecuaciones de estado . En muchas situaciones, no estamos realmente interesados en conocer el estado físico, sino solo sus efectos sobre algunos objetos (por ejemplo, los efectos que tiene el campo gravitatorio sobre un planeta específico). Por lo tanto, tenemos que introducir otro operador, llamado operador de observación , que convierte el estado del sistema físico (aquí el campo gravitatorio predicho) en lo que queremos observar (aquí los movimientos del planeta considerado). Ahora podemos introducir el llamado problema hacia adelante , que consta de dos pasos:
Esto lleva a introducir otro operador ( F significa "adelante") que asigna los parámetros del modelo a los datos que el modelo predice que son el resultado de este procedimiento de dos pasos. El operador se denomina operador de avance o mapa de avance . En este enfoque, básicamente, intentamos predecir los efectos conociendo las causas.
La siguiente tabla muestra, considerando la Tierra como sistema físico y para diferentes fenómenos físicos, los parámetros del modelo que describen el sistema, la cantidad física que describe el estado del sistema físico y las observaciones que se hacen comúnmente sobre el estado del sistema.
En el enfoque del problema inverso, en términos generales, tratamos de conocer las causas dados los efectos.
El problema inverso es el "inverso" del problema directo: en lugar de determinar los datos producidos por parámetros de modelo particulares, queremos determinar los parámetros de modelo que producen los datos que son la observación que hemos registrado (el subíndice obs significa observado). Nuestro objetivo, en otras palabras, es determinar los parámetros de modelo de manera que (al menos aproximadamente) donde sea el mapa directo. Denotamos por el número (posiblemente infinito) de parámetros de modelo y por el número de datos registrados. Presentamos algunos conceptos útiles y las notaciones asociadas que se utilizarán a continuación:
El concepto de residuos es muy importante: en el marco de la búsqueda de un modelo que coincida con los datos, su análisis revela si el modelo considerado puede considerarse realista o no . Las discrepancias sistemáticas no realistas entre los datos y las respuestas del modelo también revelan que el mapa de avance es inadecuado y pueden brindar información sobre un mapa de avance mejorado.
Cuando el operador es lineal, el problema inverso es lineal. De lo contrario, que es lo más frecuente, el problema inverso es no lineal. Además, los modelos no siempre se pueden describir mediante un número finito de parámetros. Es el caso cuando buscamos parámetros distribuidos (una distribución de velocidades de onda, por ejemplo): en tales casos, el objetivo del problema inverso es recuperar una o varias funciones. Tales problemas inversos son problemas inversos con dimensión infinita.
En el caso de un mapa directo lineal y cuando trabajamos con un número finito de parámetros del modelo, el mapa directo puede escribirse como un sistema lineal donde es la matriz que caracteriza al mapa directo. El sistema lineal puede resolverse mediante métodos tanto de regularización como bayesianos. [9]
Solo unos pocos sistemas físicos son realmente lineales con respecto a los parámetros del modelo. Uno de esos sistemas de la geofísica es el del campo gravitatorio de la Tierra . El campo gravitatorio de la Tierra está determinado por la distribución de la densidad de la Tierra en el subsuelo. Debido a que la litología de la Tierra cambia de manera bastante significativa, podemos observar diferencias minúsculas en el campo gravitatorio de la Tierra en la superficie de la Tierra. A partir de nuestra comprensión de la gravedad (Ley de gravitación de Newton), sabemos que la expresión matemática para la gravedad es: aquí es una medida de la aceleración gravitatoria local, es la constante gravitatoria universal , es la masa local (que está relacionada con la densidad) de la roca en el subsuelo y es la distancia desde la masa hasta el punto de observación.
Al discretizar la expresión anterior, podemos relacionar las observaciones de datos discretos en la superficie de la Tierra con los parámetros discretos del modelo (densidad) en el subsuelo sobre los que deseamos saber más. Por ejemplo, considere el caso en el que tenemos mediciones realizadas en 5 ubicaciones en la superficie de la Tierra. En este caso, nuestro vector de datos es un vector columna de dimensión (5×1): su componente -ésimo está asociado con la ubicación de observación -ésima. También sabemos que solo tenemos cinco masas desconocidas en el subsuelo (poco realista, pero se usa para demostrar el concepto) con ubicación conocida: denotamos por la distancia entre la ubicación de observación -ésima y la masa -ésima. Por lo tanto, podemos construir el sistema lineal que relaciona las cinco masas desconocidas con los cinco puntos de datos de la siguiente manera:
Para calcular los parámetros del modelo que se ajustan a nuestros datos, podríamos invertir la matriz para convertir directamente las mediciones en los parámetros de nuestro modelo. Por ejemplo: un sistema con cinco ecuaciones y cinco incógnitas es una situación muy específica: nuestro ejemplo fue diseñado para terminar con esta especificidad. En general, las cantidades de datos y de incógnitas son diferentes, por lo que la matriz no es cuadrada.
Sin embargo, incluso una matriz cuadrada no puede tener inversa: la matriz puede ser deficiente en rango (es decir, tener cero valores propios) y la solución del sistema no es única. Entonces, la solución del problema inverso será indeterminada. Esta es una primera dificultad. Los sistemas sobredeterminados (más ecuaciones que incógnitas) tienen otros problemas. Además, el ruido puede corromper nuestras observaciones, haciendo que posiblemente estén fuera del espacio de posibles respuestas a los parámetros del modelo, de modo que la solución del sistema puede no existir. Esta es otra dificultad.
La primera dificultad refleja un problema crucial: nuestras observaciones no contienen suficiente información y se requieren datos adicionales. Los datos adicionales pueden provenir de información física previa sobre los valores de los parámetros, sobre su distribución espacial o, de manera más general, sobre su dependencia mutua. También pueden provenir de otros experimentos: por ejemplo, podemos pensar en integrar datos registrados por gravímetros y sismógrafos para una mejor estimación de las densidades. La integración de esta información adicional es básicamente un problema de estadística . Esta disciplina es la que puede responder a la pregunta: ¿Cómo mezclar cantidades de diferente naturaleza? Seremos más precisos en la sección "Enfoque bayesiano" a continuación.
En lo que respecta a los parámetros distribuidos, la información previa sobre su distribución espacial a menudo consiste en información sobre algunas derivadas de estos parámetros distribuidos. Además, es una práctica común, aunque un tanto artificial, buscar el modelo "más simple" que coincida razonablemente con los datos. Esto generalmente se logra penalizando la norma del gradiente (o la variación total ) de los parámetros (este enfoque también se conoce como maximización de la entropía). También se puede simplificar el modelo mediante una parametrización que introduzca grados de libertad solo cuando sea necesario.
También se puede integrar información adicional mediante restricciones de desigualdad sobre los parámetros del modelo o algunas funciones de ellos. Estas restricciones son importantes para evitar valores irreales para los parámetros (valores negativos, por ejemplo). En este caso, el espacio abarcado por los parámetros del modelo ya no será un espacio vectorial sino un subconjunto de modelos admisibles denotados por en la secuela.
Como se mencionó anteriormente, el ruido puede ser tal que nuestras mediciones no sean la imagen de ningún modelo, de modo que no podemos buscar un modelo que produzca los datos sino más bien buscar el mejor (u óptimo) modelo : es decir, el que mejor se ajusta a los datos. Esto nos lleva a minimizar una función objetivo , es decir, una funcional que cuantifica qué tan grandes son los residuos o qué tan lejos están los datos predichos de los datos observados. Por supuesto, cuando tenemos datos perfectos (es decir, sin ruido), entonces el modelo recuperado debería ajustarse perfectamente a los datos observados. Una función objetivo estándar, , es de la forma: donde es la norma euclidiana (será la norma cuando las mediciones sean funciones en lugar de muestras) de los residuos. Este enfoque equivale a hacer uso de mínimos cuadrados ordinarios , un enfoque ampliamente utilizado en estadística. Sin embargo, se sabe que la norma euclidiana es muy sensible a los valores atípicos: para evitar esta dificultad podemos pensar en usar otras distancias, por ejemplo la norma, en reemplazo de la norma.
Muy similar al enfoque de mínimos cuadrados es el enfoque probabilístico: si conocemos las estadísticas del ruido que contamina los datos, podemos pensar en buscar el modelo más probable m, que es el modelo que cumple el criterio de máxima verosimilitud . Si el ruido es gaussiano , el criterio de máxima verosimilitud aparece como un criterio de mínimos cuadrados, siendo reemplazado el producto escalar euclidiano en el espacio de datos por un producto escalar que involucra la covarianza del ruido. Además, si se dispone de información previa sobre los parámetros del modelo, podríamos pensar en utilizar la inferencia bayesiana para formular la solución del problema inverso. Este enfoque se describe en detalle en el libro de Tarantola. [10]
Aquí utilizamos la norma euclidiana para cuantificar los desajustes de los datos. Como se trata de un problema inverso lineal, la función objetivo es cuadrática. Para su minimización, es clásico calcular su gradiente utilizando el mismo razonamiento (como lo haríamos para minimizar una función de una sola variable). En el modelo óptimo , este gradiente se desvanece, lo que se puede escribir como: donde F T denota la matriz transpuesta de F . Esta ecuación se simplifica a:
Esta expresión se conoce como ecuación normal y nos da una posible solución al problema inverso. En nuestro ejemplo, la matriz resulta ser, en general, de rango completo, de modo que la ecuación anterior tiene sentido y determina de forma única los parámetros del modelo: no necesitamos integrar información adicional para llegar a una solución única.
Los problemas inversos suelen estar mal planteados, a diferencia de los problemas bien planteados que suelen cumplirse en el modelado matemático. De las tres condiciones para un problema bien planteado sugeridas por Jacques Hadamard (existencia, unicidad y estabilidad de la solución o soluciones), la condición de estabilidad es la que se viola con mayor frecuencia. En el sentido del análisis funcional , el problema inverso se representa mediante una aplicación entre espacios métricos . Si bien los problemas inversos a menudo se formulan en espacios de dimensión infinita, las limitaciones a un número finito de mediciones y la consideración práctica de recuperar solo un número finito de parámetros desconocidos pueden llevar a que los problemas se reformulen en forma discreta. En este caso, el problema inverso normalmente estará mal condicionado . En estos casos, la regularización se puede utilizar para introducir suposiciones suaves sobre la solución y evitar el sobreajuste . Muchos casos de problemas inversos regularizados se pueden interpretar como casos especiales de inferencia bayesiana . [11]
Algunos problemas inversos tienen una solución muy simple, por ejemplo, cuando uno tiene un conjunto de funciones unisolventes , es decir, un conjunto de funciones tales que evaluarlas en puntos distintos produce un conjunto de vectores linealmente independientes . Esto significa que dada una combinación lineal de estas funciones, los coeficientes se pueden calcular organizando los vectores como las columnas de una matriz y luego invirtiendo esta matriz. El ejemplo más simple de funciones unisolventes son los polinomios construidos, utilizando el teorema de unisolvencia , de modo que sean unisolventes. Concretamente, esto se hace invirtiendo la matriz de Vandermonde . Pero esta es una situación muy específica.
En general, la solución de un problema inverso requiere algoritmos de optimización sofisticados. Cuando el modelo se describe mediante un gran número de parámetros (el número de incógnitas implicadas en algunas aplicaciones de tomografía por difracción puede alcanzar los mil millones), la solución del sistema lineal asociado a las ecuaciones normales puede resultar engorrosa. El método numérico que se utilice para resolver el problema de optimización depende en particular del coste necesario para calcular la solución del problema directo. Una vez elegido el algoritmo adecuado para resolver el problema directo (una simple multiplicación matriz-vector puede no ser adecuada cuando la matriz es enorme), el algoritmo adecuado para llevar a cabo la minimización se puede encontrar en libros de texto que tratan de métodos numéricos para la solución de sistemas lineales y para la minimización de funciones cuadráticas (véase, por ejemplo, Ciarlet [12] o Nocedal [13] ).
Además, el usuario puede desear añadir restricciones físicas a los modelos: en este caso, deben estar familiarizados con los métodos de optimización con restricciones , un tema en sí mismo. En todos los casos, calcular el gradiente de la función objetivo suele ser un elemento clave para la solución del problema de optimización. Como se mencionó anteriormente, la información sobre la distribución espacial de un parámetro distribuido se puede introducir a través de la parametrización. También se puede pensar en adaptar esta parametrización durante la optimización. [14]
Si la función objetivo se basa en una norma distinta a la norma euclidiana, debemos abandonar el área de optimización cuadrática. Como resultado, el problema de optimización se vuelve más difícil. En particular, cuando la norma se utiliza para cuantificar el desajuste de los datos, la función objetivo ya no es diferenciable: su gradiente ya no tiene sentido. En este caso, se utilizan métodos específicos (véase, por ejemplo, Lemaréchal [15] ) de optimización no diferenciable.
Una vez calculado el modelo óptimo, debemos responder a la pregunta: "¿Podemos confiar en este modelo?" La pregunta puede formularse de la siguiente manera: ¿Qué tan grande es el conjunto de modelos que coinciden con los datos "casi tan bien" como este modelo? En el caso de las funciones objetivo cuadráticas, este conjunto está contenido en un hiperelipsoide, un subconjunto de ( es el número de incógnitas), cuyo tamaño depende de lo que entendamos por "casi tan bien", es decir, del nivel de ruido. La dirección del eje más grande de este elipsoide ( vector propio asociado con el valor propio más pequeño de la matriz ) es la dirección de los componentes mal determinados: si seguimos esta dirección, podemos introducir una fuerte perturbación en el modelo sin cambiar significativamente el valor de la función objetivo y, por lo tanto, terminar con un modelo cuasi-óptimo significativamente diferente. Vemos claramente que la respuesta a la pregunta "¿podemos confiar en este modelo?" está determinada por el nivel de ruido y por los valores propios de la hessiana de la función objetivo o, equivalentemente, en el caso en que no se haya integrado ninguna regularización, por los valores singulares de la matriz . Por supuesto, el uso de la regularización (u otros tipos de información previa) reduce el tamaño del conjunto de soluciones casi óptimas y, a su vez, aumenta la confianza que podemos depositar en la solución calculada.
Aquí nos centramos en la recuperación de un parámetro distribuido. Cuando buscamos parámetros distribuidos tenemos que discretizar estas funciones desconocidas. Al hacerlo, reducimos la dimensión del problema a algo finito. Pero ahora, la pregunta es: ¿hay algún vínculo entre la solución que calculamos y la del problema inicial? Luego, otra pregunta: ¿qué queremos decir con la solución del problema inicial? Dado que un número finito de datos no permite la determinación de una infinidad de incógnitas, la función de desajuste de los datos originales tiene que ser regularizada para asegurar la unicidad de la solución. Muchas veces, reducir las incógnitas a un espacio de dimensión finita proporcionará una regularización adecuada: la solución calculada se verá como una versión discreta de la solución que estábamos buscando. Por ejemplo, una discretización ingenua a menudo funcionará para resolver el problema de deconvolución : funcionará siempre que no permitamos que aparezcan frecuencias faltantes en la solución numérica. Pero muchas veces, la regularización tiene que ser integrada explícitamente en la función objetivo.
Para entender lo que puede suceder, debemos tener en cuenta que resolver un problema inverso lineal de este tipo equivale a resolver una ecuación integral de Fredholm de primer tipo:
donde es el núcleo, y son vectores de , y es un dominio en . Esto es válido para una aplicación 2D. Para una aplicación 3D, consideramos . Nótese que aquí los parámetros del modelo consisten en una función y que la respuesta de un modelo también consiste en una función denotada por . Esta ecuación es una extensión a dimensión infinita de la ecuación matricial dada en el caso de problemas discretos.
Para que sea suficientemente suave, el operador definido anteriormente es compacto en espacios de Banach razonables como el . La teoría de F. Riesz establece que el conjunto de valores singulares de dicho operador contiene cero (de ahí la existencia de un espacio nulo), es finito o, como mucho, numerable y, en el último caso, constituyen una secuencia que tiende a cero. En el caso de un núcleo simétrico, tenemos una infinidad de valores propios y los vectores propios asociados constituyen una base hilbertiana de . Por lo tanto, cualquier solución de esta ecuación está determinada hasta una función aditiva en el espacio nulo y, en el caso de infinidad de valores singulares, la solución (que implica el recíproco de valores propios pequeños arbitrarios) es inestable: ¡dos ingredientes que hacen que la solución de esta ecuación integral sea un típico problema mal planteado! Sin embargo, podemos definir una solución a través de la pseudoinversa de la función directa (de nuevo hasta una función aditiva arbitraria). Cuando la función forward es compacta, la regularización clásica de Tikhonov funcionará si la usamos para integrar información previa que indique que la norma de la solución debe ser lo más pequeña posible: esto hará que el problema inverso esté bien planteado. Sin embargo, como en el caso de dimensión finita, tenemos que cuestionar la confianza que podemos depositar en la solución calculada. Nuevamente, básicamente, la información se encuentra en los valores propios del operador hessiano. Si se exploran subespacios que contienen vectores propios asociados con valores propios pequeños para calcular la solución, entonces la solución difícilmente será confiable: algunos de sus componentes estarán mal determinados. El valor propio más pequeño es igual al peso introducido en la regularización de Tikhonov.
Los núcleos irregulares pueden producir una función hacia delante que no sea compacta e incluso ilimitada si equipamos ingenuamente el espacio de modelos con la norma. En tales casos, el hessiano no es un operador acotado y la noción de valor propio ya no tiene sentido. Se requiere un análisis matemático para convertirlo en un operador acotado y diseñar un problema bien planteado: se puede encontrar una ilustración en [16] . Nuevamente, tenemos que cuestionar la confianza que podemos depositar en la solución calculada y tenemos que generalizar la noción de valor propio para obtener la respuesta. [17]
El análisis del espectro del operador hessiano es, por tanto, un elemento clave para determinar la fiabilidad de la solución calculada. Sin embargo, un análisis de este tipo suele ser una tarea muy pesada. Esto ha llevado a varios autores a investigar enfoques alternativos en el caso de que no estemos interesados en todos los componentes de la función desconocida, sino solo en las subincógnitas que son las imágenes de la función desconocida por un operador lineal. Estos enfoques se conocen como el "método de Backus y Gilbert [18] ", el enfoque de los centinelas de Lions [19] y el método SOLA [20] : estos enfoques resultaron estar fuertemente relacionados entre sí, como se explica en Chavent [21]. Finalmente, el concepto de resolución limitada , a menudo invocado por los físicos, no es más que una visión específica del hecho de que algunos componentes mal determinados pueden corromper la solución. Pero, en términos generales, estos componentes mal determinados del modelo no están necesariamente asociados a altas frecuencias.
Los problemas mencionados a continuación corresponden a diferentes versiones de la integral de Fredholm: cada una de ellas está asociada a un núcleo específico .
El objetivo de la deconvolución es reconstruir la imagen o señal original que aparece ruidosa y borrosa en los datos . [22] Desde un punto de vista matemático, el núcleo aquí solo depende de la diferencia entre y .
En estos métodos intentamos recuperar un parámetro distribuido, la observación consiste en la medición de las integrales de este parámetro realizada a lo largo de una familia de líneas. Denotamos por la línea en esta familia asociada con el punto de medición . La observación en puede escribirse así como: donde es la longitud de arco a lo largo de y una función de ponderación conocida. Comparando esta ecuación con la integral de Fredholm anterior, notamos que el núcleo es una especie de función delta que alcanza su pico en la línea . Con un núcleo de este tipo, la función directa no es compacta.
En la tomografía computarizada de rayos X, las líneas en las que se integra el parámetro son líneas rectas: la reconstrucción tomográfica de la distribución de parámetros se basa en la inversión de la transformada de Radon . Aunque desde un punto de vista teórico se entienden bien muchos problemas de inversión lineal, los problemas que involucran la transformada de Radon y sus generalizaciones aún presentan muchos desafíos teóricos con cuestiones de suficiencia de datos aún sin resolver. Tales problemas incluyen datos incompletos para la transformada de rayos X en tres dimensiones y problemas que involucran la generalización de la transformada de rayos X a campos tensoriales. Las soluciones exploradas incluyen la Técnica de Reconstrucción Algebraica , la retroproyección filtrada y, a medida que el poder de cómputo ha aumentado, los métodos de reconstrucción iterativos como la Varianza Mínima Asintótica Dispersa iterativa . [23]
La tomografía de difracción es un problema inverso lineal clásico en sismología de exploración: la amplitud registrada en un momento dado para un par fuente-receptor es la suma de las contribuciones que surgen de puntos tales que la suma de las distancias, medidas en tiempos de viaje, desde la fuente y el receptor, respectivamente, es igual al tiempo de registro correspondiente. En 3D, el parámetro no se integra a lo largo de líneas sino sobre superficies. Si la velocidad de propagación es constante, dichos puntos se distribuyen en un elipsoide. El problema inverso consiste en recuperar la distribución de puntos de difracción de los sismogramas registrados a lo largo del estudio, siendo conocida la distribución de velocidad. Una solución directa ha sido propuesta originalmente por Beylkin y Lambaré et al. [24]: estos trabajos fueron los puntos de partida de los enfoques conocidos como migración de amplitud preservada (ver Beylkin [25] [26] y Bleistein [27] ). Si se utilizan técnicas de óptica geométrica (es decir, rayos) para resolver la ecuación de onda, estos métodos resultan estar estrechamente relacionados con los denominados métodos de migración de mínimos cuadrados [28] derivados del enfoque de mínimos cuadrados (véase Lailly, [29] Tarantola [30] ).
Si consideramos un objeto estelar en rotación, las líneas espectrales que podemos observar en un perfil espectral se desplazarán debido al efecto Doppler. La tomografía Doppler tiene como objetivo convertir la información contenida en el seguimiento espectral del objeto en una imagen 2D de la emisión (en función de la velocidad radial y de la fase en el movimiento periódico de rotación) de la atmósfera estelar. Como explica Tom Marsh [31], este problema inverso lineal es similar a la tomografía: tenemos que recuperar un parámetro distribuido que se ha integrado a lo largo de las líneas para producir sus efectos en los registros.
Las primeras publicaciones sobre conducción térmica inversa surgieron a partir de la determinación del flujo de calor superficial durante el reingreso atmosférico a partir de sensores de temperatura enterrados. [32] [33] Otras aplicaciones en las que se necesita el flujo de calor superficial pero los sensores de superficie no son prácticos incluyen: dentro de motores alternativos, dentro de motores de cohetes; y, pruebas de componentes de reactores nucleares. [34] Se han desarrollado diversas técnicas numéricas para abordar la mala postura y la sensibilidad al error de medición causado por la amortiguación y el retraso en la señal de temperatura. [35] [36] [37]
Los problemas inversos no lineales constituyen una familia inherentemente más difícil de problemas inversos. En este caso, la función directa es un operador no lineal. La modelización de fenómenos físicos a menudo se basa en la solución de una ecuación diferencial parcial (véase la tabla anterior, excepto para la ley de la gravedad): aunque estas ecuaciones diferenciales parciales suelen ser lineales, los parámetros físicos que aparecen en estas ecuaciones dependen de forma no lineal del estado del sistema y, por tanto, de las observaciones que hagamos sobre él.
Mientras que los problemas inversos lineales se resolvieron completamente desde el punto de vista teórico a finales del siglo XIX [ cita requerida ] , solo una clase de problemas inversos no lineales lo fue antes de 1970, los problemas espectrales inversos y los problemas de dispersión inversa (de una dimensión espacial) , después del trabajo seminal de la escuela matemática rusa ( Krein , Gelfand , Levitan, Marchenko ). Chadan y Sabatier han realizado una amplia revisión de los resultados en su libro "Inverse Problems of Quantum Scattering Theory" (dos ediciones en inglés, una en ruso).
En este tipo de problemas, los datos son propiedades del espectro de un operador lineal que describen la dispersión. El espectro está formado por valores propios y funciones propias , que forman juntos el "espectro discreto", y generalizaciones, llamadas espectro continuo. El punto físico más notable es que los experimentos de dispersión dan información sólo sobre el espectro continuo, y que conocer su espectro completo es necesario y suficiente para recuperar el operador de dispersión. Por lo tanto, tenemos parámetros invisibles, mucho más interesantes que el espacio nulo que tiene una propiedad similar en problemas lineales inversos. Además, hay movimientos físicos en los que el espectro de dicho operador se conserva como consecuencia de dicho movimiento. Este fenómeno está gobernado por ecuaciones de evolución diferencial parcial no lineales especiales, por ejemplo la ecuación de Korteweg-de Vries . Si el espectro del operador se reduce a un único valor propio, su movimiento correspondiente es el de una única protuberancia que se propaga a velocidad constante y sin deformación, una onda solitaria llamada " solitón ".
La señal perfecta y sus generalizaciones para la ecuación de Korteweg-de Vries u otras ecuaciones diferenciales parciales no lineales integrables son de gran interés y tienen muchas aplicaciones posibles. Esta área se ha estudiado como una rama de la física matemática desde la década de 1970. Los problemas inversos no lineales también se estudian actualmente en muchos campos de la ciencia aplicada (acústica, mecánica, mecánica cuántica, dispersión electromagnética, en particular sondeos de radar, sondeos sísmicos y casi todas las modalidades de imagen).
Un último ejemplo relacionado con la hipótesis de Riemann fue dado por Wu y Sprung: la idea es que en la antigua teoría cuántica semiclásica , la inversa del potencial dentro del hamiltoniano es proporcional a la semiderivada de la función de conteo de valores propios (energías) n ( x ).
El objetivo es recuperar el coeficiente de difusión en la ecuación diferencial parcial parabólica que modela flujos de fluidos monofásicos en medios porosos. Este problema ha sido objeto de numerosos estudios desde un trabajo pionero realizado a principios de los años setenta. [38] En el caso de los flujos bifásicos, un problema importante es la estimación de las permeabilidades relativas y las presiones capilares. [39]
El objetivo es recuperar las velocidades de las ondas (ondas P y S) y las distribuciones de densidad a partir de sismogramas . Estos problemas inversos son de gran interés en sismología y geofísica de exploración . Básicamente, podemos considerar dos modelos matemáticos:
Estas ecuaciones hiperbólicas básicas se pueden mejorar incorporando atenuación , anisotropía , ...
La solución del problema inverso en la ecuación de onda 1D ha sido objeto de muchos estudios. Es uno de los pocos problemas inversos no lineales para los que podemos probar la unicidad de la solución. [8] El análisis de la estabilidad de la solución fue otro desafío. [40] Se desarrollaron aplicaciones prácticas, utilizando el enfoque de mínimos cuadrados. [40] [41] La extensión a problemas 2D o 3D y a las ecuaciones de elastodinámica se intentó desde los años 80, ¡pero resultó ser muy difícil! Este problema, a menudo denominado inversión de forma de onda completa (FWI), aún no está completamente resuelto: entre las principales dificultades se encuentran la existencia de ruido no gaussiano en los sismogramas, problemas de salto de ciclo (también conocido como ambigüedad de fase) y el comportamiento caótico de la función de desajuste de datos. [42] Algunos autores han investigado la posibilidad de reformular el problema inverso para hacer que la función objetivo sea menos caótica que la función de desajuste de datos. [43] [44]
Al darse cuenta de la dificultad del problema inverso en la ecuación de onda, los sismólogos investigaron un enfoque simplificado que utiliza la óptica geométrica. En particular, se propusieron invertir la distribución de la velocidad de propagación, conociendo los tiempos de llegada de los frentes de onda observados en los sismogramas. Estos frentes de onda pueden estar asociados a llegadas directas o a reflexiones asociadas a reflectores cuya geometría se debe determinar, junto con la distribución de la velocidad.
La distribución del tiempo de llegada ( es un punto en el espacio físico) de un frente de onda emitido desde una fuente puntual, satisface la ecuación de Eikonal : donde denota la distribución de lentitud (recíproca de la velocidad). La presencia de hace que esta ecuación no sea lineal. Se resuelve clásicamente disparando rayos (trayectorias sobre las cuales el tiempo de llegada es estacionario) desde la fuente puntual.
Este problema es similar a la tomografía: los tiempos de llegada medidos son la integral a lo largo de la trayectoria del rayo de la lentitud. Pero este problema similar a la tomografía es no lineal, principalmente porque la geometría desconocida de la trayectoria del rayo depende de la distribución de la velocidad (o lentitud). A pesar de su carácter no lineal, la tomografía de tiempo de viaje resultó ser muy eficaz para determinar la velocidad de propagación en la Tierra o en el subsuelo, siendo este último aspecto un elemento clave para la obtención de imágenes sísmicas, en particular utilizando los métodos mencionados en la Sección "Tomografía por difracción".
Las preguntas se refieren a la precisión del planteamiento: ¿el problema de mínimos cuadrados tiene una solución única que depende continuamente de los datos (problema de estabilidad)? Es la primera pregunta, pero también es difícil debido a la no linealidad de . Para ver de dónde surgen las dificultades, Chavent [45] propuso dividir conceptualmente la minimización de la función de desajuste de datos en dos pasos consecutivos ( es el subconjunto de modelos admisibles):
Pueden surgir dificultades (y normalmente surgirán) en ambos pasos:
Nos remitimos a Chavent [45] para un análisis matemático de estos puntos.
Como el mapa de avance no es lineal, es probable que la función de desajuste de datos no sea convexa, lo que hace que las técnicas de minimización local sean ineficientes. Se han investigado varios enfoques para superar esta dificultad:
Los problemas inversos, especialmente en dimensión infinita, pueden ser de gran tamaño, por lo que requieren un tiempo de cálculo importante. Cuando la función directa no es lineal, las dificultades computacionales aumentan y minimizar la función objetivo puede resultar difícil. Al contrario de lo que ocurre en la situación lineal, un uso explícito de la matriz de Hesse para resolver las ecuaciones normales no tiene sentido en este caso: la matriz de Hesse varía con los modelos. La evaluación del gradiente de la función objetivo para algunos modelos es mucho más eficaz. Se puede ahorrar un importante esfuerzo computacional cuando podemos evitar el cálculo muy pesado del jacobiano (a menudo llamado " derivadas de Fréchet "): el método de estados adjuntos, propuesto por Chavent y Lions, [48] tiene como objetivo evitar este cálculo muy pesado. En la actualidad, se utiliza ampliamente. [49]
La teoría del problema inverso se utiliza ampliamente en predicciones meteorológicas, oceanografía, hidrología e ingeniería petrolera. [51] [52] [53] Otra aplicación es la inversión de ondas elásticas para la caracterización no destructiva de estructuras de ingeniería. [50]
También se encuentran problemas inversos en el campo de la transferencia de calor, donde se estima un flujo de calor superficial [54] saliente a partir de datos de temperatura medidos dentro de un cuerpo rígido; y en la comprensión de los controles sobre la descomposición de la materia vegetal. [55] El problema inverso lineal también es fundamental para la estimación espectral y la estimación de la dirección de llegada (DOA) en el procesamiento de señales .
La litografía inversa se utiliza en el diseño de fotomáscaras para la fabricación de dispositivos semiconductores .
Cuatro revistas académicas principales cubren problemas inversos en general:
Muchas revistas sobre imágenes médicas, geofísica, pruebas no destructivas, etc. están dominadas por problemas inversos en esas áreas.
{{cite book}}
: CS1 maint: location (link)