En la teoría de los procesos estocásticos , el filtrado describe el problema de determinar el estado de un sistema a partir de un conjunto de observaciones incompleto y potencialmente ruidoso . Aunque originalmente estaba motivado por problemas de ingeniería, el filtrado encontró aplicaciones en muchos campos, desde el procesamiento de señales hasta las finanzas.
El problema del filtrado no lineal óptimo (incluso para el caso no estacionario) fue resuelto por Ruslan L. Stratonovich (1959, [1] 1960 [2] ), ver también el trabajo de Harold J. Kushner [3] y Moshe Zakai 's, quien introdujo una dinámica simplificada para la ley condicional no normalizada del filtro [4] conocida como ecuación de Zakai . La solución, sin embargo, en el caso general es de dimensión infinita. [5] Ciertas aproximaciones y casos especiales se comprenden bien: por ejemplo, los filtros lineales son óptimos para variables aleatorias gaussianas y se conocen como filtro de Wiener y filtro de Kalman-Bucy . De manera más general, como la solución es de dimensión infinita, requiere que se implementen aproximaciones de dimensión finita en una computadora con memoria finita. Un filtro no lineal aproximado de dimensión finita puede basarse más en heurísticas, como el filtro de Kalman extendido o los filtros de densidad asumidos, [6] o más orientado metodológicamente, como por ejemplo los filtros de proyección , [7] algunas subfamilias de las cuales son Se muestra que coincide con los filtros de densidad asumida. [8] Los filtros de partículas [9] son otra opción para atacar el problema del filtrado de dimensiones infinitas y se basan en métodos secuenciales de Monte Carlo.
En general, si se aplica el principio de separación , entonces el filtrado también surge como parte de la solución de un problema de control óptimo . Por ejemplo, el filtro de Kalman es la parte de estimación de la solución de control óptima para el problema de control lineal-cuadrático-gaussiano .
Considere un espacio de probabilidad (Ω, Σ, P ) y suponga que el estado (aleatorio) Y t en el espacio euclidiano n - dimensional R n de un sistema de interés en el tiempo t es una variable aleatoria Y t : Ω → R n dada por la solución a una ecuación diferencial estocástica de Itō de la forma
donde B denota movimiento browniano p -dimensional estándar , b : [0, +∞) × R n → R n es el campo de deriva, y σ : [0, +∞) × R n → R n × p es el campo de difusión . Se supone que las observaciones H t en R m (tenga en cuenta que m y n pueden, en general, ser desiguales) se toman para cada tiempo t de acuerdo con
Adoptando la interpretación de Itō del diferencial estocástico y su configuración.
esto da la siguiente representación integral estocástica para las observaciones Z t :
donde W denota movimiento browniano estándar r -dimensional , independiente de B y de la condición inicial Y 0 , y c : [0, +∞) × R n → R n y γ : [0, +∞) × R n → R n × r satisfacer
para todo t y x y alguna constante C .
El problema de filtrado es el siguiente: dadas las observaciones Z s para 0 ≤ s ≤ t , ¿cuál es la mejor estimación Ŷ t del estado verdadero Y t del sistema basado en esas observaciones?
Por "basado en esas observaciones" se entiende que Ŷ t es mensurable con respecto a la σ -álgebra G t generada por las observaciones Z s , 0 ≤ s ≤ t . Denotemos por K = K ( Z , t ) la colección de todas las variables aleatorias Y con valores R n que son integrables al cuadrado y medibles G t :
Por "mejor estimación" se entiende que Ŷ t minimiza la distancia cuadrática media entre Y t y todos los candidatos en K :
El espacio K ( Z , t ) de candidatos es un espacio de Hilbert , y la teoría general de los espacios de Hilbert implica que la solución Ŷ t del problema de minimización (M) está dada por
donde P K ( Z , t ) denota la proyección ortogonal de L 2 (Ω, Σ, P ; R n ) sobre el subespacio lineal K ( Z , t ) = L 2 (Ω, G t , P ; R n ). Además, es un hecho general acerca de las expectativas condicionales que si F es cualquier sub -álgebra σ de Σ entonces la proyección ortogonal
es exactamente el operador de expectativa condicional E [·| F ], es decir,
Por eso,
Este resultado elemental es la base de la ecuación general de Fujisaki-Kallianpur-Kunita de la teoría del filtrado.
El conocimiento completo del filtro en un tiempo t estaría dado por la ley de probabilidad de la señal Y t condicionada al campo sigma G t generado por las observaciones Z hasta el tiempo t . Si esta ley de probabilidad admite una densidad, informalmente
luego, bajo algunos supuestos de regularidad, la densidad satisface una ecuación diferencial parcial estocástica no lineal (SPDE) impulsada por la llamada ecuación de Kushner-Stratonovich , [10] o una versión no normalizada de la densidad satisface una SPDE lineal llamada ecuación de Zakai . [10] Estas ecuaciones pueden formularse para el sistema anterior, pero para simplificar la exposición se puede suponer que la señal no observada Y y la señal ruidosa parcialmente observada Z satisfacen las ecuaciones
En otros términos, el sistema se simplifica suponiendo que el ruido de observación W no depende del estado.
Se podría mantener un tiempo dependiente determinista delante, pero suponemos que esto se ha eliminado mediante el cambio de escala.
Para este sistema en particular, el SPDE de Kushner-Stratonovich para la densidad dice
donde T denota transposición, denota la expectativa con respecto a la densidad p y el operador de difusión directa es
dónde . Si elegimos la densidad no normalizada , el Zakai SPDE para el mismo sistema lee
Estos SPDE para p y q están escritos en forma de cálculo Ito. Es posible escribirlos en forma de cálculo de Stratonovich, lo que resulta útil al derivar aproximaciones de filtrado basadas en geometría diferencial, como en los filtros de proyección. Por ejemplo, la ecuación de Kushner-Stratonovich escrita en el cálculo de Stratonovich dice
A partir de cualquiera de las densidades p y q se pueden calcular todas las estadísticas de la señal Y t condicionadas al campo sigma generado por las observaciones Z hasta el momento t , de modo que las densidades proporcionen un conocimiento completo del filtro. Bajo los supuestos particulares de constante lineal con respecto a Y , donde los coeficientes del sistema b y c son funciones lineales de Y y donde y no dependen de Y , siendo la condición inicial para la señal Y gaussiana o determinista, la densidad es gaussiana. y se puede caracterizar por su matriz de media y varianza-covarianza, cuya evolución se describe mediante el filtro de Kalman-Bucy , que es de dimensión finita. [10] De manera más general, la evolución de la densidad del filtro ocurre en un espacio funcional de dimensión infinita, [5] y debe aproximarse mediante una aproximación de dimensión finita, como se indicó anteriormente.