stringtranslate.com

Notación de placa

En la inferencia bayesiana , la notación de placas es un método para representar variables que se repiten en un modelo gráfico . En lugar de dibujar cada variable repetida individualmente, se utiliza una placa o un rectángulo para agrupar las variables en un subgrafo que se repiten juntas, y se dibuja un número en la placa para representar el número de repeticiones del subgrafo en la placa. [1] Las suposiciones son que el subgrafo se duplica esa cantidad de veces, las variables en el subgrafo están indexadas por el número de repetición y cualquier vínculo que cruce un límite de placa se replica una vez por cada repetición del subgrafo. [2]

Ejemplo

Notación de placa para la asignación de Dirichlet latente

En este ejemplo, consideramos la asignación de Dirichlet latente , una red bayesiana que modela cómo se relacionan temáticamente los documentos de un corpus. Hay dos variables que no están en ninguna placa; α es el parámetro de la distribución uniforme a priori de Dirichlet en las distribuciones de temas por documento, y β es el parámetro de la distribución uniforme a priori de Dirichlet en la distribución de palabras por tema.

La placa más externa representa todas las variables relacionadas con un documento específico, incluida la distribución de temas para el documento i . La M en la esquina de la placa indica que las variables en el interior se repiten M veces, una vez para cada documento. La placa interna representa las variables asociadas con cada una de las palabras en el documento i : es la distribución de temas para la j -ésima palabra en el documento i , y es la palabra real utilizada.

La N en la esquina representa la repetición de las variables en las placas internas , una vez por cada palabra del documento i . El círculo que representa las palabras individuales está sombreado, lo que indica que cada una es observable , y los otros círculos están vacíos, lo que indica que las otras variables son variables latentes . Los bordes dirigidos entre las variables indican dependencias entre las variables: por ejemplo, cada una depende de y β .

Extensiones

Modelo de mezcla gaussiana multivariante bayesiano que utiliza notación de placas. Los cuadrados más pequeños indican parámetros fijos; los círculos más grandes indican variables aleatorias. Las formas rellenas indican valores conocidos. La indicación [K] significa un vector de tamaño K ; [D,D] significa una matriz de tamaño D × D ; K solo significa una variable categórica con K resultados. La línea ondulada que sale de z y termina en una barra transversal indica un interruptor : el valor de esta variable selecciona, para las otras variables entrantes, qué valor utilizar de la matriz de tamaño K de valores posibles.

Varios autores han creado una serie de extensiones para expresar más información que simplemente las relaciones condicionales. Sin embargo, pocas de ellas se han convertido en estándar. Quizás la extensión más utilizada es la de utilizar rectángulos en lugar de círculos para indicar variables no aleatorias, ya sean parámetros que se deben calcular, hiperparámetros a los que se les da un valor fijo (o que se calculan mediante el método Bayesiano empírico ) o variables cuyos valores se calculan de manera determinista a partir de una variable aleatoria.

El diagrama de la derecha muestra algunas convenciones no estándar más utilizadas en algunos artículos de Wikipedia (por ejemplo, Bayes variacional ):

Implementación de software

La notación de placas se ha implementado en varios paquetes de dibujo TeX / LaTeX , pero también como parte de interfaces gráficas de usuario para programas de estadísticas bayesianas como BUGS , BayesiaLab y PyMC .

Referencias

  1. ^ Ghahramani, Zoubin (agosto de 2007). Modelos gráficos (discurso). Tübingen, Alemania . Consultado el 21 de febrero de 2008 .
  2. ^ Buntine, Wray L. (diciembre de 1994). "Operaciones para el aprendizaje con modelos gráficos" (PDF) . Journal of Artificial Intelligence Research . 2 . AI Access Foundation: 159–225. arXiv : cs/9412102 . Bibcode :1994cs.......12102B. doi :10.1613/jair.62. ISSN  1076-9757. S2CID  11672931 . Consultado el 21 de febrero de 2008 .