stringtranslate.com

El método de Laplace

En matemáticas , el método de Laplace , llamado así en honor a Pierre-Simon Laplace , es una técnica utilizada para aproximar integrales de la forma

donde es una función dos veces diferenciable , es un número grande y los puntos finales y podrían ser infinitos. Esta técnica fue presentada originalmente en el libro Laplace (1774).

En estadística bayesiana , la aproximación de Laplace puede referirse a aproximar la constante de normalización posterior con el método de Laplace [1] o aproximar la distribución posterior con una gaussiana centrada en la estimación máxima a posteriori . [2] Las aproximaciones de Laplace se utilizan en el método integrado de aproximaciones anidadas de Laplace para aproximaciones rápidas de la inferencia bayesiana .

Concepto

tiene un máximo global en . se muestra arriba y abajo (ambos en azul). A medida que crece, mejora la aproximación de esta función mediante una función gaussiana (mostrada en rojo). Esta observación subyace al método de Laplace.

Supongamos que la función tiene un máximo global único en . Sea una constante y considere las siguientes dos funciones:

Tenga en cuenta que será el máximo global de y también. Ahora observa:

A medida que M aumenta, la proporción de crecerá exponencialmente, mientras que la proporción de no cambia. Por lo tanto, las contribuciones significativas a la integral de esta función provendrán sólo de puntos en la vecindad de , que luego pueden estimarse.

teoría general

Para enunciar y motivar el método, se deben hacer varias suposiciones. Se supone que no es un punto final del intervalo de integración y que los valores no pueden estar muy cerca a menos que estén cerca de .

se puede expandir alrededor de x 0 mediante el teorema de Taylor ,

donde (ver: notación O grande ).

Dado que tiene un máximo global en y no es un punto final, es un punto estacionario , es decir . Por lo tanto, la aproximación del polinomio de Taylor de segundo orden es

Entonces, sólo se necesita un paso más para obtener una distribución gaussiana. Dado que es un máximo global de la función se puede afirmar, por definición de la segunda derivada , que , dando así la relación

para cerca de . Entonces la integral se puede aproximar con:

Esta última integral es una integral gaussiana si los límites de integración van de a (lo cual se puede suponer porque la exponencial decae muy rápidamente alejándose de ), y por lo tanto se puede calcular. Esto da

El libro Fog (2008) proporciona una generalización de este método y una extensión a la precisión arbitraria.

Declaración formal y prueba

Supongamos que es una función dos veces continuamente diferenciable y existe un punto único tal que:

Entonces:

Prueba

Límite inferior: Sea . Como es continua existe tal que si entonces Por el teorema de Taylor , para cualquier

Entonces tenemos el siguiente límite inferior:

donde la última igualdad se obtuvo por un cambio de variables

Recuerda que podemos sacar la raíz cuadrada de su negación.

Si dividimos ambos lados de la desigualdad anterior por

y tomamos el límite que obtenemos:

Como esto es cierto para arbitrarios, obtenemos el límite inferior:

Tenga en cuenta que esta prueba también funciona cuando o (o ambos).

Límite superior: la prueba es similar a la del límite inferior, pero existen algunos inconvenientes. Nuevamente comenzamos eligiendo un pero para que la prueba funcione necesitamos lo suficientemente pequeño como para que Entonces, como arriba, por continuidad de y Teorema de Taylor podemos encontrar que si , entonces

Por último, según nuestras suposiciones (suponiendo que sean finitas) existe tal que si , entonces .

Entonces podemos calcular el siguiente límite superior:

Si dividimos ambos lados de la desigualdad anterior por

y tomamos el límite que obtenemos:

Como es arbitrario obtenemos el límite superior:

Y combinando esto con el límite inferior se obtiene el resultado.

Tenga en cuenta que la prueba anterior obviamente falla cuando o (o ambos). Para abordar estos casos, necesitamos algunos supuestos adicionales. Una suposición suficiente (no necesaria) es que para

y que el número anterior existe (tenga en cuenta que esto debe ser una suposición en el caso de que el intervalo sea infinito). La prueba procede de manera diferente a la anterior, pero con una aproximación de integrales ligeramente diferente:

Cuando dividimos por

obtenemos para este término

cuyo límite tal como es . El resto de la prueba (el análisis del término interesante) procede como arriba.

La condición dada en el caso del intervalo infinito es, como se dijo anteriormente, suficiente pero no necesaria. Sin embargo, la condición se cumple en muchas, si no en la mayoría, de las aplicaciones: la condición simplemente dice que la integral que estamos estudiando debe estar bien definida (no infinita) y que el máximo de la función at debe ser un máximo "verdadero". (el número debe existir). No hay necesidad de exigir que la integral sea finita para pero basta con exigir que la integral sea finita para algún

Este método se basa en 4 conceptos básicos como

Conceptos
1. Error relativo

La “aproximación” en este método está relacionada con el error relativo y no con el error absoluto . Por tanto, si fijamos

la integral se puede escribir como

donde es un número pequeño cuando es un número grande obviamente y el error relativo será

Ahora, separemos esta integral en dos partes: región y resto.

2. alrededor del punto estacionario cuando sea lo suficientemente grande

Miremos la expansión de Taylor de alrededor de x 0 y traslademos x a y porque hacemos la comparación en el espacio y, obtendremos

Tenga en cuenta que porque es un punto estacionario. A partir de esta ecuación, encontrará que los términos superiores a la segunda derivada en esta expansión de Taylor se suprimen en el orden de, de modo que se acercarán a la función gaussiana como se muestra en la figura. Además,

La cifra de con es igual a 1, 2 y 3, y la línea roja es la curva de función .
3. Cuanto mayor es, menor es el rango de relación

Debido a que hacemos la comparación en el espacio y, se fija cuál causará ; sin embargo, es inversamente proporcional a , la región elegida de será más pequeña cuando aumente.

4. Si la integral del método de Laplace converge, la contribución de la región que no está alrededor del punto estacionario de la integración de su error relativo tenderá a cero a medida que crece.

Confiando en el tercer concepto, incluso si elegimos un D y muy grande , sD y finalmente será un número muy pequeño cuando se aumente a un número enorme. Entonces, ¿cómo podemos garantizar que la integral del resto tenderá a 0 cuando sea lo suficientemente grande?

La idea básica es encontrar una función tal que y la integral de will tienda a cero cuando crece. Porque la función exponencial de será siempre mayor que cero siempre que sea un número real, y esta función exponencial es proporcional a la integral de tenderá a cero. Para simplificar, elija como tangente a través del punto como se muestra en la figura:

se denota por las dos rectas tangentes que pasan por . Cuando sea más pequeña, la región de cobertura será más grande.

Si el intervalo de integración de este método es finito, encontraremos que no importa si continúa en la región de reposo, siempre será más pequeño que lo que se muestra arriba cuando sea lo suficientemente grande. Por cierto, más adelante se demostrará que la integral de tenderá a cero cuando sea lo suficientemente grande.

Si el intervalo de integración de este método es infinito, siempre podrían cruzarse entre sí. Si es así, no podemos garantizar que la integral de will tienda finalmente a cero. Por ejemplo, en el caso de siempre divergirá. Por lo tanto, debemos exigir que pueda converger para el caso de intervalo infinito. Si es así, esta integral tenderá a cero cuando sea lo suficientemente grande y podemos elegirla como el cruce de y

Quizás se pregunte por qué no elegirla como integral convergente. Déjame usar un ejemplo para mostrarte la razón. Supongamos que el resto de es entonces y su integral divergerá; sin embargo, cuando la integral de converge. Entonces, la integral de algunas funciones divergirá cuando no sea un número grande, pero convergerá cuando sea lo suficientemente grande.

Con base en estos cuatro conceptos, podemos derivar el error relativo de este método.

Otras formulaciones

La aproximación de Laplace a veces se escribe como

donde es positivo.

Es importante destacar que la precisión de la aproximación depende de la variable de integración, es decir, de lo que queda y de lo que entra [3]

La derivación de su error relativo.

Primero, use para denotar el máximo global, lo que simplificará esta derivación. Nos interesa el error relativo, escrito como ,

dónde

Entonces, si dejamos

y podemos conseguir

desde .

Para el límite superior, tenga en cuenta que así podemos separar esta integración en 5 partes con 3 tipos diferentes (a), (b) y (c), respectivamente. Por lo tanto,

donde y son similares, calculemos y y también son similares, simplemente calcularé .

Porque , después de la traducción de , podemos obtener

Esto significa que mientras sea lo suficientemente grande, tenderá a cero.

Para , podemos obtener

dónde

y debe tener el mismo signo de durante esta región. Elijamos como tangente al punto en , es decir, que se muestra en la figura.

son las rectas tangentes que cruzan el punto en .

En esta figura se puede encontrar que cuando o se hace más pequeño, la región que satisface la desigualdad anterior se hará más grande. Por tanto, si queremos encontrar un adecuado para cubrir la totalidad durante el intervalo de , tendrá un límite superior. Además, debido a que la integración de es simple, permítanme usarla para estimar el error relativo contribuido por esto .

Basado en la expansión de Taylor, podemos obtener

y

y luego sustitúyalos nuevamente en el cálculo de ; sin embargo, puedes encontrar que los restos de estas dos expansiones son inversamente proporcionales a la raíz cuadrada de ; déjame omitirlos para embellecer el cálculo. Conservarlos es mejor, pero hará que la fórmula sea más fea.

Por lo tanto, tenderá a cero cuando crezca, pero no olvide que se debe considerar el límite superior de durante este cálculo.

En cuanto a la integración cercana a , también podemos usar el teorema de Taylor para calcularla. Cuando

y puedes encontrar que es inversamente proporcional a la raíz cuadrada de . De hecho, se comportará igual cuando sea una constante.

En conclusión, la integral cerca del punto estacionario se hará más pequeña a medida que crezca, y las partes restantes tenderán a cero siempre que sea lo suficientemente grande; sin embargo, debemos recordar que tiene un límite superior que se decide en función de si la función es siempre mayor que en la región de reposo. Sin embargo, siempre que podamos encontrar uno que satisfaga esta condición, el límite superior de puede elegirse como directamente proporcional a desde es una tangente a través del punto de en . Entonces, cuanto más grande es, más grande puede ser.

En el caso multivariado, donde es un vector dimensional y es una función escalar de , la aproximación de Laplace generalmente se escribe como:

donde es la matriz de Hesse evaluada en y donde denota el determinante de la matriz . De manera análoga al caso univariado, se requiere que el hessiano sea definido negativo . [4]

Por cierto, aunque denota un vector de dimensiones, el término aquí denota un volumen infinitesimal , es decir .

Extensión de descenso más empinada

En extensiones del método de Laplace, el análisis complejo , y en particular la fórmula integral de Cauchy , se utiliza para encontrar un contorno de descenso más pronunciado para una integral equivalente (asintóticamente con M grande), expresada como una integral de línea . En particular, si no existe ningún punto x 0 donde la derivada de desaparece en la línea real, puede ser necesario deformar el contorno de integración a uno óptimo, donde el análisis anterior será posible. Nuevamente, la idea principal es reducir, al menos asintóticamente, el cálculo de la integral dada al de una integral más simple que pueda evaluarse explícitamente. Véase el libro de Erdelyi (1956) para una discusión sencilla (donde el método se denomina descensos más pronunciados ).

La formulación apropiada para el plano z complejo es

para un camino que pasa por el punto de silla en z 0 . Nótese la aparición explícita de un signo menos para indicar la dirección de la segunda derivada: no se debe tomar el módulo. También tenga en cuenta que si el integrando es meromórfico , es posible que tenga que agregar residuos correspondientes a los polos atravesados ​​mientras se deforma el contorno (consulte, por ejemplo, la sección 3 del artículo de Okounkov Funciones simétricas y particiones aleatorias ).

Más generalizaciones

Una extensión del método de descenso más pronunciado es el llamado método de fase estacionaria no lineal/descenso más pronunciado . Aquí, en lugar de integrales, es necesario evaluar asintóticamente soluciones de problemas de factorización de Riemann-Hilbert .

Dado un contorno C en la esfera compleja , una función definida en ese contorno y un punto especial, como el infinito, se busca una función holomorfa M lejos de C , con un salto prescrito a través de C , y con una normalización dada en el infinito. Si y por tanto M son matrices en lugar de escalares, este es un problema que en general no admite una solución explícita.

Entonces es posible una evaluación asintótica según el método de fase estacionaria lineal/descenso más pronunciado. La idea es reducir asintóticamente la solución del problema de Riemann-Hilbert dado a la de un problema de Riemann-Hilbert más simple y explícitamente solucionable. El teorema de Cauchy se utiliza para justificar las deformaciones del contorno del salto.

La fase estacionaria no lineal fue introducida por Deift y Zhou en 1993, basándose en trabajos anteriores de Its. Kamvissis, K. McLaughlin y P. Miller introdujeron un método de descenso más pronunciado (propiamente hablando) no lineal en 2003, basado en trabajos anteriores de Lax, Levermore, Deift, Venakides y Zhou. Como en el caso lineal, los "curvos de descenso más pronunciados" resuelven un problema mínimo-máximo. En el caso no lineal resultan ser "curvas en S" (definidas en un contexto diferente allá por los años 80 por Stahl, Gonchar y Rakhmanov).

El método de fase estacionaria no lineal/descenso más pronunciado tiene aplicaciones a la teoría de ecuaciones de solitones y modelos integrables , matrices aleatorias y combinatoria .

Generalización de la aproximación del punto mediano

En la generalización, la evaluación de la integral se considera equivalente a encontrar la norma de la distribución con densidad.

Denotando la distribución acumulativa , si existe una distribución gaussiana difeomorfa con densidad

la norma está dada por

y el difeomorfismo correspondiente es

donde denota la función de distribución normal estándar acumulativa .

En general, cualquier distribución difeomorfa a la distribución gaussiana tiene densidad

y el punto mediano se asigna a la mediana de la distribución gaussiana. Al hacer coincidir el logaritmo de las funciones de densidad y sus derivadas en el punto mediano hasta un orden dado se obtiene un sistema de ecuaciones que determinan los valores aproximados de y .

La aproximación fue introducida en 2019 por D. Makogon y C. Morais Smith principalmente en el contexto de la evaluación de la función de partición para un sistema de fermiones que interactúan. [5]

Integrales complejas

Para integrales complejas de la forma:

con hacemos la sustitución t = iu y el cambio de variable para obtener la transformada de Laplace bilateral:

Luego dividimos g ( c + ix ) en su parte real y compleja, después de lo cual recuperamos u = t / i . Esto es útil para las transformadas inversas de Laplace , la fórmula de Perron y la integración compleja.

Ejemplo: la aproximación de Stirling

El método de Laplace se puede utilizar para derivar la aproximación de Stirling.

para un número entero grande N .

De la definición de la función Gamma , tenemos

Ahora cambiamos las variables, dejando que vuelva a conectar estos valores para obtener

Esta integral tiene la forma necesaria para el método de Laplace con

que es dos veces diferenciable:

El máximo de se encuentra en z 0 = 1, y la segunda derivada de tiene el valor −1 en este punto. Por lo tanto, obtenemos

Ver también

Notas

  1. ^ Tierney, Lucas; Kadane, José B. (1986). "Aproximaciones precisas para momentos posteriores y densidades marginales". J.Amer. Estadístico. Asociación . 81 (393): 82–86. doi :10.1080/01621459.1986.10478240.
  2. ^ Amaral Turkman, M. Antónia; Paulino, Carlos Daniel; Müller, Peter (2019). "Métodos basados ​​en aproximaciones analíticas". Estadística bayesiana computacional: una introducción . Prensa de la Universidad de Cambridge. págs. 150-171. ISBN 978-1-108-70374-1.
  3. ^ Mayordomo, Ronald W (2007). Aproximaciones y aplicaciones de punto de silla . Prensa de la Universidad de Cambridge. ISBN 978-0-521-87250-8.
  4. ^ MacKay, David JC (septiembre de 2003). Teoría de la información, inferencia y algoritmos de aprendizaje. Cambridge: Prensa de la Universidad de Cambridge. ISBN 9780521642989.
  5. ^ Makogon, D.; Morais Smith, C. (3 de mayo de 2022). "Aproximación del punto medio y su aplicación para el estudio de sistemas fermiónicos". Revisión física B. 105 (17): 174505. Código bibliográfico : 2022PhRvB.105q4505M. doi : 10.1103/PhysRevB.105.174505. hdl : 1874/423769 . S2CID  203591796.

Referencias

Este artículo incorpora material de la aproximación del punto de silla en PlanetMath , que tiene la licencia Creative Commons Attribution/Share-Alike License .