Control estocástico

Aquí el modelo es lineal, la función objetivo es el valor esperado de una forma cuadrática, y las perturbaciones son puramente aditivas.

Si alguna de las hipótesis anteriores no se cumple (ya sea que la ecuación de estado sea no lineal, que haya una función objetivo no cuadrática, ruido en los parámetros multiplicativos del modelo o descentralización del control), entonces la propiedad de equivalencia cierta no se cumplirá.

Encontrar la solución óptima para el momento actual puede implicar la iteración una ecuación de Riccati en forma de matriz hacia atrás en el tiempo desde el último período para el período actual.

Suponemos que cada elemento de A y B se distribuye de forma conjunta independiente e idéntica a través del tiempo, por lo que las operaciones de valor esperado no tienen que ser condicionales al tiempo.

La inducción hacia atrás en el tiempo puede usarse para obtener la solución de control óptima en cada momento,[2]: ch. 13