Campo aleatorio de Markov

En el ámbito de la física y la probabilidad, un Campo aleatorio de Markov (abreviado MRF por sus siglas en inglés), Red Markov o modelo gráfico no dirigido es un conjunto de variables aleatorias que poseen la propiedad de Markov descrito por un grafo no dirigido.Un MRF es similar a una red bayesiana en su representación de las dependencias entre variables aleatorias; la diferencia radica en que las redes bayesianas son dirigidas y acíclicas, mientras que en los MRF las redes son no dirigidas y pueden ser cíclicas.El grafo subyacente de un MRF puede ser finito o infinito.si satisfacen las propiedades de Markov locales: Las tres propiedades anteriores no son equivalentes: la primera es más débil que la segunda y esta es más débil que la tercera.es la probabilidad de encontrar que las variables aleatoriasdeben tomarse con respecto a una distribución conjunta deSi esta densidad conjunta se puede factorizar sobre el clique deforma un campo aleatorio de Markov con respecto aLa definición es equivalente si solo se utiliza el máximo de los cliques.La palabra potencial se aplica a menudo al logaritmo de φC.Esto se debe a que, en la estadística mecánica log(φC) tiene una interpretación directa como la energía potencial de la configuraciónA pesar de que algunos MRFs no factoricen (un ejemplo sencillo puede ser construido con un ciclo de 4 nodos), en algunos casos puede ser mostrado que son equivalentes bajo ciertas condiciones:[3]​ Cuándo tal factorización existe, es posible de construir un grafo de factores para la red.Cualquier MRF (con una densidad estrictamente positiva) puede ser reescrito como un modelo logístico con funciones de característicastal que la distribución de probabilidad conjunta puede ser escrita: donde la notación Es sencillamente un producto escalar sobre las configuraciones del campo, y Z es la función de partición: Aquí,corresponde a la i-ésima configuración posible del k-ésimo clique, o 0 en otro caso.es la cardinalidad del clique, y el peso correspondiente a una funciónla i-ésima configuración posible del k-ésimo clique, i.e.La probabilidad P es llamada a menuda la medida de Gibbs.Esta representación de un MRF como un modelo logístico sólo es posible si todos los factores de un clique son no nulos, i.e.Esto permite que se puedan aplicar técnicas del álgebra matricial.Además, la función de partición permite la aplicación de métodos variacionales para la solución del problema: se puede aplicar una fuerza de a una o más variables aleatorias, y estudiar la forma en que cambia la red en respuesta a esta perturbación.Así, por ejemplo, uno puede añadir un término Jv, a cada vértice v del grafo, obteniéndose: Formalmente diferenciando con respecto a Jv se obtiene el valor esperado de la variable aleatoria Xv asociada al vértice v: Las funciones de correlación se calculan de la mima manera; la correlación de dos puntos es: Los modelos logísticos son especialmente convenientes debido a su interpretación.Un modelo logístico provee una forma mucho más compacta de representar muchas distribuciones, especialmente cuando las variables tienen dominios muy grandes.También son convenientes porque su función de verosimilitud es convexa.Una distribución normal multivariante forma un MRF con respecto a un grafoen el MRF, sumando sobre todas las posibles asignaciones de losSin embargo esto es un problema NP-completo, y por tanto computacionalmente costoso para el caso general.Existen casos particulares de MRFs, como los árboles, que poseen algoritmos de inferencia polinomiales; encontrar estos casos particulares es un campo de investigación activo en la actualidad.Existen también subconjuntos de MRFs que permiten la inferencia del MAP o la asignación más verosímil, de manera eficiente; ejemplos de estos son las redes asociativas.[5]​[6]​ Otro subconjunto interesante es el de los modelos descomponibles (cuando el grafo es cordal): existiendo en este caso una forma cerrada para MLE, es posible descubrir una estructura consistente para cientos de variables.
Los nodos X representan estados mientras que los nodos Y representan observaciones sobre esos estados