Concepto en la teoría de la probabilidad
En teoría de probabilidad , un núcleo de Markov (también conocido como núcleo estocástico o núcleo de probabilidad ) es un mapa que en la teoría general de procesos de Markov desempeña el papel que desempeña la matriz de transición en la teoría de procesos de Markov con un espacio de estados finito . [1]
Definición formal
Sean y espacios medibles . Un núcleo de Markov con origen y destino , a veces escrito como , es una función con las siguientes propiedades:
- Para cada (fijo) , el mapa es - medible
- Para cada (fijo) , el mapa es una medida de probabilidad en
En otras palabras, asocia a cada punto una medida de probabilidad en tal que, para cada conjunto medible , la función es medible con respecto al -álgebra . [2]
Ejemplos
Paseo aleatorio simplesobre los números enteros
Tome , y (el conjunto potencia de ). Entonces, un núcleo de Markov está completamente determinado por la probabilidad que asigna a los singletons para cada :
- .
Ahora bien, el paseo aleatorio que va hacia la derecha con probabilidad y hacia la izquierda con probabilidad se define por
donde es el delta de Kronecker . Las probabilidades de transición para el paseo aleatorio son equivalentes al núcleo de Markov.
GeneralProcesos de Markovcon espacio de estados contables
En términos más generales, tomemos tanto contables como . Nuevamente, un núcleo de Markov se define por la probabilidad que asigna a los conjuntos singleton para cada
- ,
Definimos un proceso de Markov definiendo una probabilidad de transición donde los números definen una matriz estocástica (contable), es decir
Luego definimos
- .
Nuevamente la probabilidad de transición, la matriz estocástica y el kernel de Markov son reformulaciones equivalentes.
Núcleo de Markov definido por una función de núcleo y una medida
Sea una medida en , y una función medible con respecto al producto -álgebra tal que
- ,
entonces es decir el mapeo
define un núcleo de Markov. [3] Este ejemplo generaliza el ejemplo del proceso contable de Markov donde era la medida de conteo . Además, abarca otros ejemplos importantes como los núcleos de convolución, en particular los núcleos de Markov definidos por la ecuación del calor. El último ejemplo incluye el núcleo gaussiano con la medida de Lebesgue estándar y
- .
Funciones mensurables
Tome espacios medibles arbitrarios y sea una función medible. Ahora defina ie
- Para todos .
Tenga en cuenta que la función del indicador es medible para todos si y solo si es medible.
Este ejemplo nos permite pensar en un núcleo de Markov como una función generalizada con un valor (en general) aleatorio en lugar de seguro. Es decir, es una función multivaluada en la que los valores no tienen la misma ponderación.
Proceso de Galton-Watson
Como ejemplo menos obvio, tomemos , y los números reales con el álgebra sigma estándar de conjuntos de Borel . Entonces
donde es el número de elementos en el estado , son variables aleatorias iid (generalmente con media 0) y donde es la función indicadora. Para el caso simple de lanzamientos de monedas, esto modela los diferentes niveles de un tablero de Galton .
Composición de los núcleos de Markov
Dados espacios mensurables , consideramos un núcleo de Markov como un morfismo . Intuitivamente, en lugar de asignar a cada uno un punto claramente definido, el núcleo asigna un punto "difuso" en el que sólo se conoce con cierto nivel de incertidumbre, de forma muy similar a las mediciones físicas reales. Si tenemos un tercer espacio mensurable y núcleos de probabilidad y , podemos definir una composición mediante la ecuación de Chapman-Kolmogorov
- .
La composición es asociativa por el Teorema de Convergencia Monótona y la función identidad considerada como un núcleo de Markov (es decir, la medida delta ) es la unidad para esta composición.
Esta composición define la estructura de una categoría en los espacios medibles con núcleos de Markov como morfismos, definidos por primera vez por Lawvere, [4] la categoría de núcleos de Markov .
Espacio de probabilidad definido por una distribución de probabilidad y un núcleo de Markov
Una composición de un espacio de probabilidad y un núcleo de probabilidad define un espacio de probabilidad , donde la medida de probabilidad está dada por
Propiedades
Producto semidirecto
Sea un espacio de probabilidad y un núcleo de Markov de a algún . Entonces existe una medida única en , tal que:
Distribución condicional regular
Sea un espacio de Borel , una variable aleatoria valuada en el espacio de medida y una subálgebra . Entonces existe un núcleo de Markov de a , tal que es una versión de la esperanza condicional para cada , es decir
Se llama distribución condicional regular de datos y no está definida de forma única.
Generalizaciones
Los núcleos de transición generalizan los núcleos de Markov en el sentido de que para todos , el mapa
Puede ser cualquier tipo de medida (no negativa), no necesariamente una medida de probabilidad.
Enlaces externos
- Núcleo de Markov en nLab.
Referencias
- ^ Reiss, RD (1993). Un curso sobre procesos puntuales . Springer Series in Statistics. doi :10.1007/978-1-4613-9308-5. ISBN 978-1-4613-9310-8.
- ^ Klenke, Achim (2014). Teoría de la probabilidad: un curso completo . Universitext (2.ª ed.). Springer. pág. 180. doi :10.1007/978-1-4471-5361-0. ISBN 978-1-4471-5360-3.
- ^ Erhan, Cinlar (2011). Probabilidad y estocástica . Nueva York: Springer. pp. 37–38. ISBN 978-0-387-87858-4.
- ^ FW Lawvere (1962). "La categoría de aplicaciones probabilísticas" (PDF) .
- Bauer, Heinz (1996), Teoría de la probabilidad , de Gruyter, ISBN 3-11-013935-9
- §36. Núcleos y semigrupos de núcleos
Véase también