stringtranslate.com

Modelo gráfico

Un modelo gráfico o modelo gráfico probabilístico ( PGM ) o modelo probabilístico estructurado es un modelo probabilístico para el cual un gráfico expresa la estructura de dependencia condicional entre variables aleatorias . Se utilizan comúnmente en teoría de la probabilidad , estadística —particularmente estadística bayesiana— y aprendizaje automático .

Tipos de modelos gráficos

En general, los modelos gráficos probabilísticos utilizan una representación basada en grafos como base para codificar una distribución en un espacio multidimensional y un grafo que es una representación compacta o factorizada de un conjunto de independencias que se cumplen en la distribución específica. Se utilizan comúnmente dos ramas de representaciones gráficas de distribuciones, a saber, las redes bayesianas y los campos aleatorios de Markov . Ambas familias abarcan las propiedades de factorización e independencias, pero difieren en el conjunto de independencias que pueden codificar y la factorización de la distribución que inducen. [1]

Modelo gráfico no dirigido

Un gráfico no dirigido con cuatro vértices.
Un gráfico no dirigido con cuatro vértices.

El gráfico no dirigido que se muestra puede tener varias interpretaciones; la característica común es que la presencia de una arista implica algún tipo de dependencia entre las variables aleatorias correspondientes. De este gráfico podríamos deducir que son todas mutuamente independientes, una vez que se conoce, o (equivalentemente en este caso) que

para algunas funciones no negativas .

Red bayesiana

Ejemplo de un grafo acíclico dirigido en cuatro vértices.
Ejemplo de un grafo acíclico dirigido en cuatro vértices.


Si la estructura de red del modelo es un grafo acíclico dirigido , el modelo representa una factorización de la probabilidad conjunta de todas las variables aleatorias. Más precisamente, si los eventos son entonces la probabilidad conjunta satisface

donde es el conjunto de padres del nodo (nodos con aristas dirigidas hacia ). En otras palabras, la distribución conjunta se factoriza en un producto de distribuciones condicionales. Por ejemplo, en el gráfico acíclico dirigido que se muestra en la Figura, esta factorización sería

.

Dos nodos cualesquiera son condicionalmente independientes dados los valores de sus padres. En general, dos conjuntos de nodos cualesquiera son condicionalmente independientes dado un tercer conjunto si se cumple un criterio llamado d -separación en el grafo. Las independencias locales y las independencias globales son equivalentes en las redes bayesianas.

Este tipo de modelo gráfico se conoce como modelo gráfico dirigido, red bayesiana o red de creencias. Los modelos clásicos de aprendizaje automático, como los modelos ocultos de Markov , las redes neuronales y los modelos más nuevos, como los modelos de Markov de orden variable, pueden considerarse casos especiales de redes bayesianas.

Una de las redes bayesianas más simples es el clasificador Naive Bayes .

Modelos gráficos cíclicos dirigidos

Un ejemplo de un modelo gráfico dirigido.
Ejemplo de un modelo gráfico cíclico y dirigido. Cada flecha indica una dependencia. En este ejemplo: D depende de A, B y C; y C depende de B y D; mientras que A y B son independientes.

La siguiente figura muestra un modelo gráfico con un ciclo. Esto puede interpretarse en términos de que cada variable "depende" de los valores de sus padres de alguna manera. El gráfico particular que se muestra sugiere una densidad de probabilidad conjunta que se factoriza como

,

Pero son posibles otras interpretaciones. [2]

Otros tipos

Modelo TAN para "conjunto de datos de corral".

Aplicaciones

El marco de los modelos, que proporciona algoritmos para descubrir y analizar la estructura en distribuciones complejas para describirlas sucintamente y extraer la información no estructurada, permite construirlos y utilizarlos de manera efectiva. [1] Las aplicaciones de los modelos gráficos incluyen la inferencia causal , la extracción de información , el reconocimiento de voz , la visión por computadora , la decodificación de códigos de verificación de paridad de baja densidad , el modelado de redes reguladoras de genes , la búsqueda de genes y el diagnóstico de enfermedades, y los modelos gráficos para la estructura de proteínas .

Véase también

Notas

  1. ^ ab Koller, D .; Friedman, N. (2009). Modelos gráficos probabilísticos. Massachusetts: MIT Press. pag. 1208.ISBN​ 978-0-262-01319-2Archivado desde el original el 27 de abril de 2014.
  2. ^ Richardson, Thomas (1996). "Un algoritmo de descubrimiento para gráficos cíclicos dirigidos". Actas de la Duodécima Conferencia sobre Incertidumbre en Inteligencia Artificial . ISBN 978-1-55860-412-4.
  3. ^ Frydenberg, Morten (1990). "La propiedad de Markov del gráfico de cadena". Revista escandinava de estadística . 17 (4): 333–353. JSTOR  4616181. MR  1096723.
  4. ^ Richardson, Thomas; Spirtes, Peter (2002). "Modelos de grafos ancestrales de Markov". Anales de Estadística . 30 (4): 962–1030. CiteSeerX 10.1.1.33.4906 . doi :10.1214/aos/1031689015. MR  1926166. Zbl  1033.60008. 

Lectura adicional

Libros y capítulos de libros

Artículos de revistas

Otro

Enlaces externos