En matemáticas (específicamente, en análisis estocástico ), una difusión de Itô es una solución a un tipo específico de ecuación diferencial estocástica . Esa ecuación es similar a la ecuación de Langevin utilizada en física para describir el movimiento browniano de una partícula sometida a un potencial en un fluido viscoso . Las difusiones de Itô reciben su nombre del matemático japonés Kiyosi Itô .
Una difusión de Itô ( homogénea en el tiempo ) en un espacio euclidiano n -dimensional es un proceso X : [0, +∞) × Ω → R n definido en un espacio de probabilidad (Ω, Σ, P ) y que satisface una ecuación diferencial estocástica de la forma
donde B es un movimiento browniano m -dimensional y b : R n → R n y σ : R n → R n × m satisfacen la condición de continuidad de Lipschitz habitual
para alguna constante C y todos los x , y ∈ R n ; esta condición asegura la existencia de una única solución fuerte X para la ecuación diferencial estocástica dada anteriormente. El campo vectorial b se conoce como el coeficiente de deriva de X ; el campo matricial σ se conoce como el coeficiente de difusión de X . Es importante notar que b y σ no dependen del tiempo; si dependieran del tiempo, X se mencionaría solo como un proceso de Itô , no como una difusión. Las difusiones de Itô tienen varias propiedades interesantes, que incluyen
En particular, una difusión de Itô es un proceso continuo, fuertemente markoviano, tal que el dominio de su operador característico incluye todas las funciones diferenciables dos veces de forma continua , por lo que es una difusión en el sentido definido por Dynkin (1965).
Una difusión de Itô X es un proceso continuo de muestra , es decir, para casi todas las realizaciones B t (ω) del ruido, X t (ω) es una función continua del parámetro de tiempo, t . Más exactamente, existe una "versión continua" de X , un proceso continuo Y de modo que
Esto se desprende de la teoría estándar de existencia y unicidad para soluciones fuertes de ecuaciones diferenciales estocásticas.
Además de ser (muestra) continua, una difusión de Itô X satisface el requisito más fuerte de ser un proceso de Feller-continuo .
Para un punto x ∈ R n , sea P x la ley de X dado el dato inicial X 0 = x , y sea E x la expectativa con respecto a P x .
Sea f : R n → R una función Borel - medible que está acotada inferiormente y defina, para t fijo ≥ 0, u : R n → R por
El comportamiento de la función u anterior cuando varía el tiempo t se aborda mediante la ecuación inversa de Kolmogorov, la ecuación de Fokker-Planck, etc. (véase más abajo).
Una difusión de Itô X tiene la importante propiedad de ser markoviana : el comportamiento futuro de X , dado lo que ha sucedido hasta un tiempo t , es el mismo que si el proceso se hubiera iniciado en la posición X t en el tiempo 0. La formulación matemática precisa de esta afirmación requiere alguna notación adicional:
Sea Σ ∗ la filtración natural de (Ω, Σ) generada por el movimiento browniano B : para t ≥ 0,
Es fácil demostrar que X está adaptado a Σ ∗ (es decir, cada X t es Σ t -medible), por lo que la filtración natural F ∗ = F ∗ X de (Ω, Σ) generada por X tiene F t ⊆ Σ t para cada t ≥ 0.
Sea f : R n → R una función acotada, medible por Borel. Entonces, para todo t y h ≥ 0, la esperanza condicional condicionada a la σ-álgebra Σ t y la esperanza del proceso "reiniciado" a partir de X t satisfacen la propiedad de Markov :
De hecho, X también es un proceso de Markov con respecto a la filtración F ∗ , como lo muestra lo siguiente:
La propiedad fuerte de Markov es una generalización de la propiedad de Markov antes mencionada en la que t se reemplaza por un tiempo aleatorio adecuado τ : Ω → [0, +∞] conocido como tiempo de detención . Por lo tanto, por ejemplo, en lugar de "reiniciar" el proceso X en el tiempo t = 1, se podría "reiniciar" siempre que X alcance primero un punto específico p de R n .
Como antes, sea f : R n → R una función acotada, medible por Borel. Sea τ un tiempo de detención con respecto a la filtración Σ ∗ con τ < +∞ casi con seguridad . Entonces, para todo h ≥ 0,
Asociado a cada difusión de Itô, hay un operador diferencial parcial de segundo orden conocido como el generador de la difusión. El generador es muy útil en muchas aplicaciones y codifica una gran cantidad de información sobre el proceso X . Formalmente, el generador infinitesimal de una difusión de Itô X es el operador A , que se define para actuar sobre funciones adecuadas f : R n → R por
El conjunto de todas las funciones f para las que existe este límite en un punto x se denota D A ( x ), mientras que D A denota el conjunto de todas las f para las que existe el límite para todo x ∈ R n . Se puede demostrar que cualquier función f con soporte compacto C 2 (dos veces diferenciable con segunda derivada continua) se encuentra en D A y que
o, en términos del gradiente y de los productos internos escalares y de Frobenius ,
El generador A para el movimiento browniano n -dimensional estándar B , que satisface la ecuación diferencial estocástica d X t = d B t , viene dado por
es decir, A = Δ/2, donde Δ denota el operador de Laplace .
El generador se utiliza en la formulación de la ecuación inversa de Kolmogorov. Intuitivamente, esta ecuación nos dice cómo evoluciona en el tiempo el valor esperado de cualquier estadística adecuadamente suave de X : debe resolver una cierta ecuación diferencial parcial en la que el tiempo t y la posición inicial x son las variables independientes. Más precisamente, si f ∈ C 2 ( R n ; R ) tiene soporte compacto y u : [0, +∞) × R n → R se define por
entonces u ( t , x ) es diferenciable con respecto a t , u ( t , ·) ∈ D A para todo t , y u satisface la siguiente ecuación diferencial parcial , conocida como ecuación inversa de Kolmogorov :
La ecuación de Fokker-Planck (también conocida como ecuación directa de Kolmogorov ) es en cierto sentido el " adjunto " de la ecuación inversa, y nos dice cómo evolucionan las funciones de densidad de probabilidad de X t con el tiempo t . Sea ρ( t , ·) la densidad de X t con respecto a la medida de Lebesgue en R n , es decir, para cualquier conjunto medible por Borel S ⊆ R n ,
Sea A ∗ el adjunto hermítico de A (con respecto al producto interno L 2 ). Entonces, dado que la posición inicial X 0 tiene una densidad prescrita ρ 0 , ρ( t , x ) es diferenciable con respecto a t , ρ( t , ·) ∈ D A * para todo t , y ρ satisface la siguiente ecuación diferencial parcial, conocida como ecuación de Fokker-Planck :
La fórmula de Feynman–Kac es una generalización útil de la ecuación inversa de Kolmogorov. Nuevamente, f está en C 2 ( R n ; R ) y tiene soporte compacto, y q : R n → R se toma como una función continua que está acotada inferiormente. Defina una función v : [0, +∞) × R n → R por
La fórmula de Feynman-Kac establece que v satisface la ecuación diferencial parcial
Además, si w : [0, +∞) × R n → R es C 1 en el tiempo, C 2 en el espacio, acotado en K × R n para todo K compacto , y satisface la ecuación diferencial parcial anterior, entonces w debe ser v como se definió anteriormente.
La ecuación hacia atrás de Kolmogorov es el caso especial de la fórmula de Feynman-Kac en la que q ( x ) = 0 para todo x ∈ R n .
El operador característico de una difusión de Itô X es un operador diferencial parcial estrechamente relacionado con el generador, pero algo más general. Es más adecuado para ciertos problemas, por ejemplo en la solución del problema de Dirichlet .
El operador característico de una difusión de Itô X se define por
donde los conjuntos U forman una secuencia de conjuntos abiertos U k que decrecen hasta el punto x en el sentido de que
y
es el primer tiempo de salida de U para X . denota el conjunto de todos los f para los que existe este límite para todos los x ∈ R n y todas las secuencias { U k }. Si E x [τ U ] = +∞ para todos los conjuntos abiertos U que contienen x , defina
El operador característico y el generador infinitesimal están muy relacionados, e incluso coinciden para una gran clase de funciones. Se puede demostrar que
Y eso
En particular, el generador y el operador característico concuerdan para todas las funciones C 2 f , en cuyo caso
Arriba, se calculó que el generador (y por lo tanto el operador característico) del movimiento browniano en R n era 1/2 Δ, donde Δ denota el operador de Laplace. El operador característico es útil para definir el movimiento browniano en una variedad de Riemann de dimensión m ( M , g ): un movimiento browniano en M se define como una difusión en M cuyo operador característico en coordenadas locales x i , 1 ≤ i ≤ m , está dado por 1/2 Δ LB , donde Δ LB es el operador de Laplace-Beltrami dado en coordenadas locales por
donde [ g ij ] = [ g ij ] −1 en el sentido de la inversa de una matriz cuadrada .
En general, el generador A de una difusión de Itô X no es un operador acotado . Sin embargo, si se resta de A un múltiplo positivo del operador identidad I , el operador resultante es invertible. La inversa de este operador se puede expresar en términos de X mismo utilizando el operador resolvente .
Para α > 0, el operador resolvente R α , que actúa sobre funciones continuas acotadas g : R n → R , se define por
Se puede demostrar, utilizando la continuidad de Feller de la difusión X , que R α g es en sí misma una función continua y acotada. Además, R α y α I − A son operadores mutuamente inversos:
A veces es necesario encontrar una medida invariante para una difusión de Itô X , es decir, una medida en R n que no cambie bajo el "flujo" de X : es decir, si X 0 se distribuye de acuerdo con dicha medida invariante μ ∞ , entonces X t también se distribuye de acuerdo con μ ∞ para cualquier t ≥ 0. La ecuación de Fokker-Planck ofrece una forma de encontrar dicha medida, al menos si tiene una función de densidad de probabilidad ρ ∞ : si X 0 se distribuye de hecho de acuerdo con una medida invariante μ ∞ con densidad ρ ∞ , entonces la densidad ρ( t , ·) de X t no cambia con t , por lo que ρ( t , ·) = ρ ∞ , y por lo tanto ρ ∞ debe resolver la ecuación diferencial parcial (independiente del tiempo)
Esto ilustra una de las conexiones entre el análisis estocástico y el estudio de ecuaciones diferenciales parciales. Por el contrario, una ecuación diferencial parcial lineal de segundo orden dada de la forma Λ f = 0 puede ser difícil de resolver directamente, pero si Λ = A ∗ para alguna difusión de Itô X y una medida invariante para X es fácil de calcular, entonces la densidad de esa medida proporciona una solución a la ecuación diferencial parcial.
Una medida invariante es comparativamente fácil de calcular cuando el proceso X es un flujo de gradiente estocástico de la forma
donde β > 0 desempeña el papel de una temperatura inversa y Ψ : R n → R es un potencial escalar que satisface condiciones adecuadas de suavidad y crecimiento. En este caso, la ecuación de Fokker-Planck tiene una solución estacionaria única ρ ∞ (es decir, X tiene una medida invariante única μ ∞ con densidad ρ ∞ ) y está dada por la distribución de Gibbs :
donde la función de partición Z viene dada por
Además, la densidad ρ ∞ satisface un principio variacional : minimiza sobre todas las densidades de probabilidad ρ en R n la funcional de energía libre F dada por
dónde
desempeña el papel de una función energética y
es el negativo de la funcional de entropía de Gibbs-Boltzmann. Incluso cuando el potencial Ψ no se comporta lo suficientemente bien como para que se definan la función de partición Z y la medida de Gibbs μ ∞ , la energía libre F [ρ( t , ·)] todavía tiene sentido para cada tiempo t ≥ 0, siempre que la condición inicial tenga F [ρ(0, ·)] < +∞. La funcional de energía libre F es, de hecho, una función de Lyapunov para la ecuación de Fokker-Planck: F [ρ( t , ·)] debe disminuir a medida que t aumenta. Por lo tanto, F es una función H para la dinámica X.
Consideremos el proceso Ornstein-Uhlenbeck X en R n que satisface la ecuación diferencial estocástica
donde m ∈ R n y β, κ > 0 son constantes dadas. En este caso, el potencial Ψ viene dado por
y por lo tanto la medida invariante para X es una medida gaussiana con densidad ρ ∞ dada por
Heurísticamente, para t grande , X t se distribuye aproximadamente de manera normal con media m y varianza (βκ) −1 . La expresión para la varianza puede interpretarse de la siguiente manera: valores grandes de κ significan que el pozo de potencial Ψ tiene "lados muy empinados", por lo que es poco probable que X t se aleje mucho del mínimo de Ψ en m ; de manera similar, valores grandes de β significan que el sistema es bastante "frío" con poco ruido, por lo que, nuevamente, es poco probable que X t se aleje mucho de m .
En general, una difusión de Itô X no es una martingala . Sin embargo, para cualquier f ∈ C 2 ( R n ; R ) con soporte compacto, el proceso M : [0, +∞) × Ω → R definido por
donde A es el generador de X , es una martingala con respecto a la filtración natural F ∗ de (Ω, Σ) por X . La demostración es bastante simple: se sigue de la expresión habitual de la acción del generador sobre funciones suficientemente suaves f y del lema de Itô (la regla de la cadena estocástica ) que
Dado que las integrales de Itô son martingalas con respecto a la filtración natural Σ ∗ de (Ω, Σ) por B , para t > s ,
Por lo tanto, como se requiere,
ya que M s es F s -medible.
La fórmula de Dynkin, llamada así por Eugene Dynkin , da el valor esperado de cualquier estadística adecuadamente suave de una difusión de Itô X (con generador A ) en un tiempo de detención. Precisamente, si τ es un tiempo de detención con E x [τ] < +∞, y f : R n → R es C 2 con soporte compacto, entonces
La fórmula de Dynkin se puede utilizar para calcular muchas estadísticas útiles de tiempos de parada. Por ejemplo, el movimiento browniano canónico en la línea real que comienza en 0 sale del intervalo (− R , + R ) en un tiempo aleatorio τ R con valor esperado
La fórmula de Dynkin proporciona información sobre el comportamiento de X en un tiempo de parada bastante general. Para obtener más información sobre la distribución de X en un tiempo de impacto , se puede estudiar la medida armónica del proceso.
En muchas situaciones, es suficiente saber cuándo una difusión de Itô X saldrá por primera vez de un conjunto medible H ⊆ R n . Es decir, se desea estudiar el primer momento de salida
A veces, sin embargo, también se desea conocer la distribución de los puntos en los que X sale del conjunto. Por ejemplo, el movimiento browniano canónico B en la línea real que comienza en 0 sale del intervalo (−1, 1) en −1 con probabilidad 1/2 y a las 1 con probabilidad 1/2 , por lo que B τ (−1, 1) se distribuye uniformemente en el conjunto {−1, 1}.
En general, si G está incrustado de forma compacta dentro de R n , entonces la medida armónica (o distribución de impacto ) de X en el límite ∂ G de G es la medida μ G x definida por
para x ∈ G y F ⊆ ∂ G .
Volviendo al ejemplo anterior del movimiento browniano, se puede demostrar que si B es un movimiento browniano en R n que comienza en x ∈ R n y D ⊂ R n es una bola abierta centrada en x , entonces la medida armónica de B en ∂ D es invariante bajo todas las rotaciones de D alrededor de x y coincide con la medida de superficie normalizada en ∂ D .
La medida armónica satisface una propiedad interesante del valor medio : si f : R n → R es cualquier función acotada, medible mediante Borel y φ viene dado por
entonces, para todos los conjuntos de Borel G ⊂⊂ H y todos los x ∈ G ,
La propiedad del valor medio es muy útil en la solución de ecuaciones diferenciales parciales utilizando procesos estocásticos .
Sea A un operador diferencial parcial en un dominio D ⊆ R n y sea X una difusión de Itô con A como su generador. Intuitivamente, la medida de Green de un conjunto de Borel H es el tiempo esperado que X permanece en H antes de que abandone el dominio D . Es decir, la medida de Green de X con respecto a D en x , denotada G ( x , ·), se define para conjuntos de Borel H ⊆ R n por
o para funciones continuas acotadas f : D → R por
El nombre "medida verde" proviene del hecho de que si X es el movimiento browniano, entonces
donde G ( x , y ) es la función de Green para el operador 1/2 Δ en el dominio D .
Supongamos que E x [τ D ] < +∞ para todo x ∈ D . Entonces la fórmula de Green se cumple para todo f ∈ C 2 ( R n ; R ) con soporte compacto:
En particular, si el soporte de f está integrado de forma compacta en D ,