En general, los modelos gráficos probabilísticos utilizan una representación basada en grafos como base para codificar una distribución en un espacio multidimensional y un grafo que es una representación compacta o factorizada de un conjunto de independencias que se cumplen en la distribución específica. Se utilizan comúnmente dos ramas de representaciones gráficas de distribuciones, a saber, las redes bayesianas y los campos aleatorios de Markov . Ambas familias abarcan las propiedades de factorización e independencias, pero difieren en el conjunto de independencias que pueden codificar y la factorización de la distribución que inducen. [1]
Modelo gráfico no dirigido
El gráfico no dirigido que se muestra puede tener varias interpretaciones; la característica común es que la presencia de una arista implica algún tipo de dependencia entre las variables aleatorias correspondientes. De este gráfico podríamos deducir que son todas mutuamente independientes, una vez que se conoce, o (equivalentemente en este caso) que
para algunas funciones no negativas .
Red bayesiana
Si la estructura de red del modelo es un grafo acíclico dirigido , el modelo representa una factorización de la probabilidad conjunta de todas las variables aleatorias. Más precisamente, si los eventos son entonces la probabilidad conjunta satisface
donde es el conjunto de padres del nodo (nodos con aristas dirigidas hacia ). En otras palabras, la distribución conjunta se factoriza en un producto de distribuciones condicionales. Por ejemplo, en el gráfico acíclico dirigido que se muestra en la Figura, esta factorización sería
.
Dos nodos cualesquiera son condicionalmente independientes dados los valores de sus padres. En general, dos conjuntos de nodos cualesquiera son condicionalmente independientes dado un tercer conjunto si se cumple un criterio llamado d -separación en el grafo. Las independencias locales y las independencias globales son equivalentes en las redes bayesianas.
La siguiente figura muestra un modelo gráfico con un ciclo. Esto puede interpretarse en términos de que cada variable "depende" de los valores de sus padres de alguna manera. El gráfico particular que se muestra sugiere una densidad de probabilidad conjunta que se factoriza como
Un gráfico factorial es un gráfico bipartito no dirigido que conecta variables y factores. Cada factor representa una función sobre las variables a las que está conectado. Esta es una representación útil para comprender e implementar la propagación de creencias .
Un grafo en cadena es un grafo que puede tener aristas dirigidas y no dirigidas, pero sin ciclos dirigidos (es decir, si comenzamos en cualquier vértice y nos movemos a lo largo del grafo respetando las direcciones de cualquier flecha, no podemos regresar al vértice del que comenzamos si hemos pasado una flecha). Tanto los grafos acíclicos dirigidos como los grafos no dirigidos son casos especiales de grafos en cadena, que por lo tanto pueden proporcionar una forma de unificar y generalizar las redes bayesianas y de Markov. [3]
Un gráfico ancestral es una extensión adicional, que tiene aristas dirigidas, bidireccionales y no dirigidas. [4]
^ ab Koller, D .; Friedman, N. (2009). Modelos gráficos probabilísticos. Massachusetts: MIT Press. pag. 1208.ISBN 978-0-262-01319-2Archivado desde el original el 27 de abril de 2014.
^ Richardson, Thomas (1996). "Un algoritmo de descubrimiento para gráficos cíclicos dirigidos". Actas de la Duodécima Conferencia sobre Incertidumbre en Inteligencia Artificial . ISBN978-1-55860-412-4.
^ Frydenberg, Morten (1990). "La propiedad de Markov del gráfico de cadena". Revista escandinava de estadística . 17 (4): 333–353. JSTOR 4616181. MR 1096723.
^ Richardson, Thomas; Spirtes, Peter (2002). "Modelos de grafos ancestrales de Markov". Anales de Estadística . 30 (4): 962–1030. CiteSeerX 10.1.1.33.4906 . doi :10.1214/aos/1031689015. MR 1926166. Zbl 1033.60008.
Lectura adicional
Libros y capítulos de libros
Barber, David (2012). Razonamiento bayesiano y aprendizaje automático . Cambridge University Press. ISBN 978-0-521-51814-7.
Bishop, Christopher M. (2006). "Capítulo 8. Modelos gráficos" (PDF) . Reconocimiento de patrones y aprendizaje automático. Springer. pp. 359–422. ISBN 978-0-387-31073-2.Señor 2247587 .
Jensen, Finn (1996). Introducción a las redes bayesianas . Berlín: Springer. ISBN 978-0-387-91502-9.
Perla, Judea (1988). Razonamiento probabilístico en sistemas inteligentes (2ª edición revisada). San Mateo, California: Morgan Kaufmann . ISBN 978-1-55860-479-7.Sr. 0965765 .Un enfoque de razonamiento computacional, donde se introdujeron formalmente las relaciones entre gráficos y probabilidades.
Artículos de revistas
Edoardo M. Airoldi (2007). "Introducción a los modelos gráficos probabilísticos". PLOS Computational Biology . 3 (12): e252. arXiv : 0706.2040 . Bibcode :2007PLSCB...3..252A. doi : 10.1371/journal.pcbi.0030252 . PMC 2134967 . PMID 18069887.
Jordan, MI (2004). "Modelos gráficos". Ciencia estadística . 19 : 140–155. doi : 10.1214/088342304000000026 .
Ghahramani, Zoubin (mayo de 2015). "Aprendizaje automático probabilístico e inteligencia artificial". Nature . 521 (7553): 452–459. Bibcode :2015Natur.521..452G. doi : 10.1038/nature14541 . PMID 26017444. S2CID 216356.
Otro
Tutorial de aprendizaje de la red bayesiana de Heckerman
Una breve introducción a los modelos gráficos y redes bayesianas
Diapositivas de la conferencia de Sargur Srihari sobre modelos gráficos probabilísticos
Enlaces externos
Modelos gráficos y campos aleatorios condicionales
Modelos gráficos probabilísticos impartidos por Eric Xing en CMU