stringtranslate.com

Núcleo de Markov

En teoría de la probabilidad , un núcleo de Markov (también conocido como núcleo estocástico o núcleo de probabilidad ) es un mapa que en la teoría general de los procesos de Markov desempeña el papel que hace la matriz de transición en la teoría de los procesos de Markov con un espacio de estados finito . [1]

Definicion formal

Dejar y ser espacios mensurables . Un kernel de Markov con origen y destino es un mapa con las siguientes propiedades:

  1. Para cada (fijo) , el mapa es - mensurable
  2. Para cada (fijo) , el mapa es una medida de probabilidad en

En otras palabras, asocia a cada punto una medida de probabilidad tal que, para cada conjunto medible , el mapa es medible con respecto al -álgebra . [2]

Ejemplos

Paseo aleatorio simple sobre números enteros

Tome , y (el conjunto potencia de ). Entonces, un núcleo de Markov está completamente determinado por la probabilidad que asigna a los singletons para cada uno :

.

Ahora el paseo aleatorio que va hacia la derecha con probabilidad y hacia la izquierda con probabilidad está definido por

¿Dónde está el delta del Kronecker ? Las probabilidades de transición para el paseo aleatorio son equivalentes al núcleo de Markov.

Procesos generales de Markov con espacio de estados contables

De manera más general, tome y tanto contable como . Nuevamente, un núcleo de Markov se define por la probabilidad que asigna a conjuntos únicos para cada

,

Definimos un proceso de Markov definiendo una probabilidad de transición donde los números definen una matriz estocástica (contable) , es decir

Luego definimos

.

Nuevamente la probabilidad de transición, la matriz estocástica y el núcleo de Markov son reformulaciones equivalentes.

Núcleo de Markov definido por una función del núcleo y una medida

Sea una medida de y una función medible con respecto al producto -álgebra tal que

,

entonces es decir, el mapeo

define un núcleo de Markov. [3] Este ejemplo generaliza el ejemplo del proceso contable de Markov donde estaba la medida de conteo . Además, abarca otros ejemplos importantes, como los núcleos de convolución, en particular los núcleos de Markov definidos por la ecuación de calor. El último ejemplo incluye el núcleo gaussiano con la medida estándar de Lebesgue y

.

Funciones medibles

Tome espacios arbitrarios y mensurables, y sea una función mensurable. Ahora define , es decir

para todos .

Tenga en cuenta que la función del indicador es medible para todos si y sólo si es medible.

Este ejemplo nos permite pensar en un núcleo de Markov como una función generalizada con un valor (en general) aleatorio en lugar de cierto. Es decir, es una función multivaluada donde los valores no tienen el mismo peso.

Proceso Galton-Watson

Como ejemplo menos obvio, tomemos y los números reales con el álgebra sigma estándar de conjuntos de Borel . Entonces

donde es el número de elemento en el estado , son variables aleatorias iid (generalmente con media 0) y donde está la función indicadora. Para el caso simple de lanzamiento de moneda, esto modela los diferentes niveles de un tablero de Galton .

Composición de los núcleos de Markov y la categoría de Markov

Dados espacios mensurables , consideramos un núcleo de Markov como un morfismo . Intuitivamente, en lugar de asignar a cada uno un punto claramente definido, el núcleo asigna un punto "borroso" que sólo se conoce con cierto nivel de incertidumbre, muy parecido a las mediciones físicas reales. Si tenemos un tercer espacio medible y núcleos de probabilidad y , podemos definir una composición por

.

La composición es asociativa según el teorema de convergencia monótona y la función de identidad considerada como un núcleo de Markov (es decir, la medida delta ) es la unidad para esta composición.

Esta composición define la estructura de una categoría en los espacios medibles con núcleos de Markov como morfismos definidos por primera vez por Lawvere. [4] La categoría tiene el conjunto vacío como objeto inicial y el conjunto de un punto como objeto terminal. Desde este punto de vista, un espacio de probabilidad es lo mismo que un espacio puntiagudo en la categoría de Markov.

Espacio de probabilidad definido por distribución de probabilidad y un núcleo de Markov

Una composición de un espacio de probabilidad y un núcleo de probabilidad define un espacio de probabilidad , donde la medida de probabilidad está dada por

Propiedades

Producto semidirecto

Sean un espacio de probabilidad y un núcleo de Markov desde a algunos . Entonces existe una medida única en , tal que:

Distribución condicional regular

Sea un espacio de Borel , una variable aleatoria valorada en el espacio de medidas y una subálgebra . Entonces existe un núcleo de Markov desde hasta , tal que es una versión de la expectativa condicional para cada , es decir

Se llama distribución condicional regular de datos dados y no está definida de forma única.

Generalizaciones

Los núcleos de transición generalizan los núcleos de Markov en el sentido de que para todos , el mapa

Puede ser cualquier tipo de medida (no negativa), no necesariamente una medida de probabilidad.

enlaces externos

Referencias

  1. ^ Reiss, RD (1993). Un curso sobre procesos puntuales . Serie Springer en Estadística. doi :10.1007/978-1-4613-9308-5. ISBN 978-1-4613-9310-8.
  2. ^ Klenke, Achim (2014). Teoría de la probabilidad: un curso completo . Universitext (2 ed.). Saltador. pag. 180. doi :10.1007/978-1-4471-5361-0. ISBN 978-1-4471-5360-3.
  3. ^ Erhan, Cinlar (2011). Probabilidad y Estocástica . Nueva York: Springer. págs. 37–38. ISBN 978-0-387-87858-4.
  4. ^ FW Lawvere (1962). "La categoría de mapeos probabilísticos" (PDF) .
§36. Granos y semigrupos de granos.