Representación predictiva del estado

En informática , una representación predictiva del estado ( PSR ) es una forma de modelar un estado de un sistema dinámico controlado a partir de un historial de acciones tomadas y observaciones resultantes. La PSR captura el estado de un sistema como un vector de predicciones para futuras pruebas (experimentos) que se pueden realizar en el sistema. ^[1] Una prueba es una secuencia de pares de acción-observación y su predicción es la probabilidad de que la secuencia de observación de la prueba ocurra si la secuencia de acción de la prueba se ejecutara en el sistema. Una de las ventajas de usar PSR es que las predicciones están directamente relacionadas con cantidades observables. Esto contrasta con otros modelos de sistemas dinámicos, como los procesos de decisión de Markov parcialmente observables (POMDP), donde el estado del sistema se representa como una distribución de probabilidad sobre estados nominales no observados. ^[2]

Referencias

^ James, Michael R.; Singh, Satinder (2004). "Aprendizaje y descubrimiento de representaciones predictivas de estados en sistemas dinámicos con reinicio". Vigésima primera conferencia internacional sobre aprendizaje automático - ICML '04 . p. 53. CiteSeerX 10.1.1.67.5179 . doi :10.1145/1015330.1015359. ISBN 978-1-58113-838-2.S2CID 9111832 .
^ Izadi, Masoumeh T.; Precup, Doina (9 de agosto de 2003). "Un algoritmo de planificación para representaciones predictivas de estados". Actas de la 18.ª Conferencia conjunta internacional sobre inteligencia artificial . Ijcai'03: 1520–1521.

Littman, Michael L. ; Richard S. Sutton ; Satinder Singh (2002). "Representaciones predictivas de estado" (PDF) . Avances en sistemas de procesamiento de información neuronal 14 (NIPS) . págs. 1555–1561.

Singh, Satinder; Michael R. James; Matthew R. Rudary (2004). "Representaciones predictivas de estados: una nueva teoría para modelar sistemas dinámicos" (PDF) . Incertidumbre en inteligencia artificial: actas de la vigésima conferencia (UAI) . pp. 512–519.

Wiewiora, Eric Walter (2008), Modelado de distribuciones de probabilidad con representaciones de estados predictivos (PDF)