Modelo gráfico

Un modelo gráfico o modelo gráfico probabilístico ( PGM ) o modelo probabilístico estructurado es un modelo probabilístico para el cual un gráfico expresa la estructura de dependencia condicional entre variables aleatorias . Se utilizan comúnmente en teoría de la probabilidad , estadística —particularmente estadística bayesiana— y aprendizaje automático .

Tipos de modelos gráficos

En general, los modelos gráficos probabilísticos utilizan una representación basada en grafos como base para codificar una distribución en un espacio multidimensional y un grafo que es una representación compacta o factorizada de un conjunto de independencias que se cumplen en la distribución específica. Se utilizan comúnmente dos ramas de representaciones gráficas de distribuciones, a saber, las redes bayesianas y los campos aleatorios de Markov . Ambas familias abarcan las propiedades de factorización e independencias, pero difieren en el conjunto de independencias que pueden codificar y la factorización de la distribución que inducen. ^[1]

Modelo gráfico no dirigido

El gráfico no dirigido que se muestra puede tener varias interpretaciones; la característica común es que la presencia de una arista implica algún tipo de dependencia entre las variables aleatorias correspondientes. De este gráfico podríamos deducir que todas son mutuamente independientes, una vez que se conoce, o (equivalentemente en este caso) que $B,C,D$ $A$

P[A,B,C,D]=f_{AB}[A,B]\cdot f_{AC}[A,C]\cdot f_{AD}[A,D]

para algunas funciones no negativas . $f_{AB},f_{AC},f_{AD}$

Red bayesiana

Si la estructura de red del modelo es un grafo acíclico dirigido , el modelo representa una factorización de la probabilidad conjunta de todas las variables aleatorias. Más precisamente, si los eventos son entonces la probabilidad conjunta satisface $X_{1},\ldots ,X_{n}$

P[X_{1},\ldots ,X_{n}]=\prod _{i=1}^{n}P[X_{i}|{\text{pa}}(X_{i})]

donde es el conjunto de padres del nodo (nodos con aristas dirigidas hacia ). En otras palabras, la distribución conjunta se factoriza en un producto de distribuciones condicionales. Por ejemplo, en el gráfico acíclico dirigido que se muestra en la Figura, esta factorización sería ${\text{pa}}(X_{i})$ $X_{i}$ $X_{i}$

P[A,B,C,D]=P[A]\cdot P[B|A]\cdot P[C|A]\cdot P[D|A,C]

Cualquier par de nodos es condicionalmente independiente dados los valores de sus padres. En general, cualquier par de conjuntos de nodos es condicionalmente independiente dado un tercer conjunto si se cumple un criterio llamado d -separación en el grafo. Las independencias locales y las independencias globales son equivalentes en las redes bayesianas.

Este tipo de modelo gráfico se conoce como modelo gráfico dirigido, red bayesiana o red de creencias. Los modelos clásicos de aprendizaje automático, como los modelos ocultos de Markov , las redes neuronales y los modelos más nuevos, como los modelos de Markov de orden variable, pueden considerarse casos especiales de redes bayesianas.

Una de las redes bayesianas más simples es el clasificador Naive Bayes .

Modelos gráficos cíclicos dirigidos

La siguiente figura muestra un modelo gráfico con un ciclo. Esto puede interpretarse en términos de que cada variable "depende" de los valores de sus padres de alguna manera. El gráfico particular que se muestra sugiere una densidad de probabilidad conjunta que se factoriza como

P[A,B,C,D]=P[A]\cdot P[B]\cdot P[C,D|A,B]

Pero son posibles otras interpretaciones. ^[2]

Otros tipos

Red de dependencia donde se permiten ciclos
Clasificador aumentado por árbol o modelo TAN

Aprendizaje de redes bayesianas dirigidas (TBNL)
Modelo TBNL para el "conjunto de datos de corral"
Un gráfico factorial es un gráfico bipartito no dirigido que conecta variables y factores. Cada factor representa una función sobre las variables a las que está conectado. Esta es una representación útil para comprender e implementar la propagación de creencias .
Un árbol de camarillas o árbol de uniones es un árbol de camarillas , utilizado en el algoritmo del árbol de uniones .
Un grafo en cadena es un grafo que puede tener aristas dirigidas y no dirigidas, pero sin ciclos dirigidos (es decir, si comenzamos en cualquier vértice y nos movemos a lo largo del grafo respetando las direcciones de cualquier flecha, no podemos regresar al vértice del que comenzamos si hemos pasado una flecha). Tanto los grafos acíclicos dirigidos como los grafos no dirigidos son casos especiales de grafos en cadena, que por lo tanto pueden proporcionar una forma de unificar y generalizar redes bayesianas y de Markov. ^[3]
Un gráfico ancestral es una extensión adicional, que tiene aristas dirigidas, bidireccionales y no dirigidas. ^[4]
Técnicas de campo aleatorio
- Un campo aleatorio de Markov , también conocido como red de Markov, es un modelo sobre un grafo no dirigido . Un modelo gráfico con muchas subunidades repetidas se puede representar con notación de placas .
- Un campo aleatorio condicional es un modelo discriminativo especificado sobre un gráfico no dirigido.
Una máquina de Boltzmann restringida es un modelo generativo bipartito especificado sobre un gráfico no dirigido.

Aplicaciones

El marco de los modelos, que proporciona algoritmos para descubrir y analizar la estructura en distribuciones complejas para describirlas sucintamente y extraer la información no estructurada, permite construirlos y utilizarlos de manera efectiva. ^[1] Las aplicaciones de los modelos gráficos incluyen la inferencia causal , la extracción de información , el reconocimiento de voz , la visión por computadora , la decodificación de códigos de verificación de paridad de baja densidad , el modelado de redes reguladoras de genes , la búsqueda de genes y el diagnóstico de enfermedades, y los modelos gráficos para la estructura de proteínas .

Véase también

Notas

^ ab Koller, D .; Friedman, N. (2009). Modelos gráficos probabilísticos. Massachusetts: MIT Press. pag. 1208.ISBN 978-0-262-01319-2Archivado desde el original el 27 de abril de 2014.
^ Richardson, Thomas (1996). "Un algoritmo de descubrimiento para gráficos cíclicos dirigidos". Actas de la Duodécima Conferencia sobre Incertidumbre en Inteligencia Artificial . ISBN 978-1-55860-412-4.
^ Frydenberg, Morten (1990). "La propiedad de Markov del gráfico de cadena". Revista escandinava de estadística . 17 (4): 333–353. JSTOR 4616181. MR 1096723.
^ Richardson, Thomas; Spirtes, Peter (2002). "Modelos de grafos ancestrales de Markov". Anales de Estadística . 30 (4): 962–1030. CiteSeerX 10.1.1.33.4906 . doi :10.1214/aos/1031689015. MR 1926166. Zbl 1033.60008.

Lectura adicional

Libros y capítulos de libros

Barber, David (2012). Razonamiento bayesiano y aprendizaje automático . Cambridge University Press. ISBN 978-0-521-51814-7.

Bishop, Christopher M. (2006). "Capítulo 8. Modelos gráficos" (PDF) . Reconocimiento de patrones y aprendizaje automático. Springer. pp. 359–422. ISBN 978-0-387-31073-2.Señor 2247587 .
Cowell, Robert G.; David, A. Felipe ; Lauritzen, Steffen L.; Spiegelhalter, David J. (1999). Redes probabilísticas y sistemas expertos . Berlín: Springer. ISBN 978-0-387-98767-5.Señor 1697175 .Un libro más avanzado y orientado estadísticamente.
Jensen, Finn (1996). Introducción a las redes bayesianas . Berlín: Springer. ISBN 978-0-387-91502-9.
Pearl, Judea (1988). Razonamiento probabilístico en sistemas inteligentes (2.ª edición revisada). San Mateo, CA: Morgan Kaufmann . ISBN 978-1-55860-479-7.Sr. 0965765 .Un enfoque de razonamiento computacional, donde se introdujeron formalmente las relaciones entre gráficos y probabilidades.

Artículos de revistas

Edoardo M. Airoldi (2007). "Introducción a los modelos gráficos probabilísticos". PLOS Computational Biology . 3 (12): e252. arXiv : 0706.2040 . Bibcode :2007PLSCB...3..252A. doi : 10.1371/journal.pcbi.0030252 . PMC 2134967 . PMID 18069887.
Jordan, MI (2004). "Modelos gráficos". Ciencia estadística . 19 : 140–155. doi : 10.1214/088342304000000026 .
Ghahramani, Zoubin (mayo de 2015). "Aprendizaje automático probabilístico e inteligencia artificial". Nature . 521 (7553): 452–459. Bibcode :2015Natur.521..452G. doi : 10.1038/nature14541 . PMID 26017444. S2CID 216356.

Otro

Tutorial de aprendizaje de la red bayesiana de Heckerman
Una breve introducción a los modelos gráficos y redes bayesianas
Diapositivas de la conferencia de Sargur Srihari sobre modelos gráficos probabilísticos

Enlaces externos

Modelos gráficos y campos aleatorios condicionales
Modelos gráficos probabilísticos impartidos por Eric Xing en CMU