Problema de filtrado (procesos estocásticos)

En la teoría de los procesos estocásticos , el filtrado describe el problema de determinar el estado de un sistema a partir de un conjunto de observaciones incompleto y potencialmente ruidoso . Aunque originalmente estaba motivado por problemas de ingeniería, el filtrado encontró aplicaciones en muchos campos, desde el procesamiento de señales hasta las finanzas.

El problema del filtrado no lineal óptimo (incluso para el caso no estacionario) fue resuelto por Ruslan L. Stratonovich (1959, ^[1] 1960 ^[2] ), ver también el trabajo de Harold J. Kushner ^[3] y Moshe Zakai 's, quien introdujo una dinámica simplificada para la ley condicional no normalizada del filtro ^[4] conocida como ecuación de Zakai . La solución, sin embargo, en el caso general es de dimensión infinita. ^[5] Ciertas aproximaciones y casos especiales se comprenden bien: por ejemplo, los filtros lineales son óptimos para variables aleatorias gaussianas y se conocen como filtro de Wiener y filtro de Kalman-Bucy . De manera más general, como la solución es de dimensión infinita, requiere que se implementen aproximaciones de dimensión finita en una computadora con memoria finita. Un filtro no lineal aproximado de dimensión finita puede basarse más en heurísticas, como el filtro de Kalman extendido o los filtros de densidad asumidos, ^[6] o más orientado metodológicamente, como por ejemplo los filtros de proyección , ^[7] algunas subfamilias de las cuales son Se muestra que coincide con los filtros de densidad asumida. ^[8] Los filtros de partículas ^[9] son otra opción para atacar el problema del filtrado de dimensiones infinitas y se basan en métodos secuenciales de Monte Carlo.

En general, si se aplica el principio de separación , entonces el filtrado también surge como parte de la solución de un problema de control óptimo . Por ejemplo, el filtro de Kalman es la parte de estimación de la solución de control óptima para el problema de control lineal-cuadrático-gaussiano .

El formalismo matemático

Considere un espacio de probabilidad (Ω, Σ, P ) y suponga que el estado (aleatorio) Y _t en el espacio euclidiano n - dimensional R ⁿ de un sistema de interés en el tiempo t es una variable aleatoria Y _t : Ω → R ⁿ dada por la solución a una ecuación diferencial estocástica de Itō de la forma

\mathrm {d} Y_{t}=b(t,Y_{t})\,\mathrm {d} t+\sigma (t,Y_{t})\,\mathrm {d} B_{t},

donde B denota movimiento browniano p -dimensional estándar , b : [0, +∞) × R ⁿ → R ⁿ es el campo de deriva, y σ : [0, +∞) × R ⁿ → R ⁿ^×^p es el campo de difusión . Se supone que las observaciones H _t en R ^m (tenga en cuenta que m y n pueden, en general, ser desiguales) se toman para cada tiempo t de acuerdo con

H_{t}=c(t,Y_{t})+\gamma (t,Y_{t})\cdot {\mbox{noise}}.

Adoptando la interpretación de Itō del diferencial estocástico y su configuración.

Z_{t}=\int _{0}^{t}H_{s}\,\mathrm {d} s,

esto da la siguiente representación integral estocástica para las observaciones Z _t :

\mathrm {d} Z_{t}=c(t,Y_{t})\,\mathrm {d} t+\gamma (t,Y_{t})\,\mathrm {d} W_{t},

donde W denota movimiento browniano estándar r -dimensional , independiente de B y de la condición inicial Y ₀ , y c : [0, +∞) × R ⁿ → R ⁿ y γ : [0, +∞) × R ⁿ → R ⁿ^×^r satisfacer

{\big |}c(t,x){\big |}+{\big |}\gamma (t,x){\big |}\leq C{\big (}1+|x|{\big )}

para todo t y x y alguna constante C .

El problema de filtrado es el siguiente: dadas las observaciones Z _s para 0 ≤ s ≤ t , ¿cuál es la mejor estimación Ŷ _t del estado verdadero Y _t del sistema basado en esas observaciones?

Por "basado en esas observaciones" se entiende que Ŷ _t es mensurable con respecto a la σ -álgebra G _t generada por las observaciones Z _s , 0 ≤ s ≤ t . Denotemos por K = K ( Z , t ) la colección de todas las variables aleatorias Y con valores R ⁿ que son integrables al cuadrado y medibles G _{t :}

K=K(Z,t)=L^{2}(\Omega ,G_{t},\mathbf {P} ;\mathbf {R} ^{n}).

Por "mejor estimación" se entiende que Ŷ _t minimiza la distancia cuadrática media entre Y _t y todos los candidatos en K :

\mathbf {E} \left[{\big |}Y_{t}-{\hat {Y}}_{t}{\big |}^{2}\right]=\inf _{Y\in K}\mathbf {E} \left[{\big |}Y_{t}-Y{\big |}^{2}\right].\qquad {\mbox{(M)}}

Resultado básico: proyección ortogonal

El espacio K ( Z , t ) de candidatos es un espacio de Hilbert , y la teoría general de los espacios de Hilbert implica que la solución Ŷ _t del problema de minimización (M) está dada por

{\hat {Y}}_{t}=P_{K(Z,t)}{\big (}Y_{t}{\big )},

donde P _{K ( Z , t )} denota la proyección ortogonal de L ² (Ω, Σ, P ; R ⁿ ) sobre el subespacio lineal K ( Z , t ) = L ² (Ω, G _t , P ; R ⁿ ). Además, es un hecho general acerca de las expectativas condicionales que si F es cualquier sub -álgebra σ de Σ entonces la proyección ortogonal

P_{K}:L^{2}(\Omega ,\Sigma ,\mathbf {P} ;\mathbf {R} ^{n})\to L^{2}(\Omega ,F,\mathbf {P} ;\mathbf {R} ^{n})

es exactamente el operador de expectativa condicional E [·| F ], es decir,

P_{K}(X)=\mathbf {E} {\big [}X{\big |}F{\big ]}.

Por eso,

{\hat {Y}}_{t}=P_{K(Z,t)}{\big (}Y_{t}{\big )}=\mathbf {E} {\big [}Y_{t}{\big |}G_{t}{\big ]}.

Este resultado elemental es la base de la ecuación general de Fujisaki-Kallianpur-Kunita de la teoría del filtrado.

Resultado más avanzado: filtrado no lineal SPDE

El conocimiento completo del filtro en un tiempo t estaría dado por la ley de probabilidad de la señal Y _t condicionada al campo sigma G _t generado por las observaciones Z hasta el tiempo t . Si esta ley de probabilidad admite una densidad, informalmente

p_{t}(y)\ dy={\bf {P}}(Y_{t}\in dy|G_{t}),

luego, bajo algunos supuestos de regularidad, la densidad satisface una ecuación diferencial parcial estocástica no lineal (SPDE) impulsada por la llamada ecuación de Kushner-Stratonovich , ^[10] o una versión no normalizada de la densidad satisface una SPDE lineal llamada ecuación de Zakai . ^[10] Estas ecuaciones pueden formularse para el sistema anterior, pero para simplificar la exposición se puede suponer que la señal no observada Y y la señal ruidosa parcialmente observada Z satisfacen las ecuaciones $p_{t}(y)$ $dZ_{t}$ $q_{t}(y)$ $p_{t}(y)$

\mathrm {d} Y_{t}=b(t,Y_{t})\,\mathrm {d} t+\sigma (t,Y_{t})\,\mathrm {d} B_{t},

\mathrm {d} Z_{t}=c(t,Y_{t})\,\mathrm {d} t+\mathrm {d} W_{t}.

En otros términos, el sistema se simplifica suponiendo que el ruido de observación W no depende del estado.

Se podría mantener un tiempo dependiente determinista delante, pero suponemos que esto se ha eliminado mediante el cambio de escala. $\gamma$ $dW$

Para este sistema en particular, el SPDE de Kushner-Stratonovich para la densidad dice $p_{t}$

\mathrm {d} p_{t}={\cal {L}}_{t}^{*}p_{t}\ dt+p_{t}[c(t,\cdot )-E_{p_{t}}(c(t,\cdot ))]^{T}[dZ_{t}-E_{p_{t}}(c(t,\cdot ))dt]

donde T denota transposición, denota la expectativa con respecto a la densidad p y el operador de difusión directa es $E_{p}$ $E_{p}[f]=\int f(y)p(y)dy,$ ${\cal {L}}_{t}^{*}$

{\cal {L}}_{t}^{*}f(t,y)=-\sum _{i}{\frac {\partial }{\partial y_{i}}}[b_{i}(t,y)f(t,y)]+{\frac {1}{2}}\sum _{i,j}{\frac {\partial ^{2}}{\partial y_{i}\partial y_{j}}}[a_{ij}(t,y)f(t,y)]

dónde . Si elegimos la densidad no normalizada , el Zakai SPDE para el mismo sistema lee $a=\sigma \sigma ^{T}$ $q_{t}(y)$

\mathrm {d} q_{t}={\cal {L}}_{t}^{*}q_{t}\ dt+q_{t}[c(t,\cdot )]^{T}dZ_{t}.

Estos SPDE para p y q están escritos en forma de cálculo Ito. Es posible escribirlos en forma de cálculo de Stratonovich, lo que resulta útil al derivar aproximaciones de filtrado basadas en geometría diferencial, como en los filtros de proyección. Por ejemplo, la ecuación de Kushner-Stratonovich escrita en el cálculo de Stratonovich dice

dp_{t}={\cal {L}}_{t}^{\ast }\,p_{t}\,dt-{\frac {1}{2}}\,p_{t}\,[\vert c(\cdot ,t)\vert ^{2}-E_{p_{t}}(\vert c(\cdot ,t)\vert ^{2})]\,dt+p_{t}\,[c(\cdot ,t)-E_{p_{t}}(c(\cdot ,t))]^{T}\circ dZ_{t}\ .

A partir de cualquiera de las densidades p y q se pueden calcular todas las estadísticas de la señal Y _t condicionadas al campo sigma generado por las observaciones Z hasta el momento t , de modo que las densidades proporcionen un conocimiento completo del filtro. Bajo los supuestos particulares de constante lineal con respecto a Y , donde los coeficientes del sistema b y c son funciones lineales de Y y donde y no dependen de Y , siendo la condición inicial para la señal Y gaussiana o determinista, la densidad es gaussiana. y se puede caracterizar por su matriz de media y varianza-covarianza, cuya evolución se describe mediante el filtro de Kalman-Bucy , que es de dimensión finita. ^[10] De manera más general, la evolución de la densidad del filtro ocurre en un espacio funcional de dimensión infinita, ^[5] y debe aproximarse mediante una aproximación de dimensión finita, como se indicó anteriormente. $\sigma$ $\gamma$ $p_{t}(y)$

Ver también

El problema del suavizado , muy relacionado con el problema del filtrado.
Filtro (procesamiento de señal)
Filtro de Kalman , un conocido algoritmo de filtrado para sistemas lineales, relacionado tanto con el problema de filtrado como con el problema de suavizado.
Filtro de Kalman extendido , una extensión del filtro de Kalman a sistemas no lineales
Suavizado
Filtros de proyección
Filtros de partículas

Referencias

^ Stratonovich, RL (1959). Sistemas no lineales óptimos que provocan una separación de una señal con parámetros constantes del ruido . Radiofizika, 2:6, págs. 892-901.
^ Stratonovich, RL (1960). Aplicación de la teoría de los procesos de Markov al filtrado óptimo . Ingeniería de radio y física electrónica, 5:11, págs.1-19.
^ Kushner, Harold . (1967). Filtrado no lineal: las ecuaciones dinámicas exactas satisfechas por el modo condicional. Control automático, IEEE Transactions en el volumen 12, número 3, junio de 1967 Página(s): 262 - 267
^ Zakai, Moshe (1969), Sobre el filtrado óptimo de los procesos de difusión. Tiempo. Wahrsch. 11 230–243. Señor 242552, Zbl 0164.19201, doi :10.1007/BF00536382
^ ab Mireille Chaleyat-Maurel y Dominique Michel. Des resultats de inexistencia de filtro de dimensión finie. Estocásticos, 13(1+2):83-102, 1984.
^ Maybeck, Peter S., Modelos estocásticos, estimación y control, Volumen 141, Serie Matemáticas en ciencias e ingeniería, 1979, Academic Press
^ Damiano Brigo , Bernard Hanzon y François LeGland, Un enfoque geométrico diferencial para el filtrado no lineal: el filtro de proyección, IEEE Transactions on Automatic Control vol. 43, 2 (1998), págs. 247-252.
^ Damiano Brigo, Bernard Hanzon y François Le Gland, Filtrado no lineal aproximado mediante proyección sobre variedades exponenciales de densidades, Bernoulli, vol. 5, N. 3 (1999), págs. 495--534
^ Del Moral, Pierre (1998). "Medir procesos valorados y sistemas de partículas que interactúan. Aplicación a problemas de filtrado no lineal". Anales de probabilidad aplicada . 8 (2) (Publicaciones del Laboratoire de Statistique et Probabilités, 96-15 (1996) ed.): 438–495. doi : 10.1214/aoap/1028903535 .
^ abc Bain, A. y Crisan, D. (2009). Fundamentos del filtrado estocástico. Springer-Verlag, Nueva York, https://doi.org/10.1007/978-0-387-76896-0

Otras lecturas

Jazwinski, Andrew H. (1970). Procesos estocásticos y teoría del filtrado . Nueva York: Academic Press. ISBN 0-12-381550-9.
Øksendal, Bernt K. (2003). Ecuaciones diferenciales estocásticas: una introducción con aplicaciones (Sexta ed.). Berlín: Springer. ISBN 3-540-04758-1.(Ver Sección 6.1)