Red bayesiana

Por ejemplo, una red bayesiana puede representar las relaciones probabilísticas entre enfermedades y síntomas.Formalmente, las redes bayesianas son grafos dirigidos acíclicos cuyos nodos representan variables aleatorias en el sentido de Bayes: las mismas pueden ser cantidades observables, variables latentes, parámetros desconocidos o hipótesis.Ideas similares pueden ser aplicadas a grafos no dirigidos, y posiblemente cíclicos; como son las llamadas redes de Markov.Existen algoritmos eficientes que llevan a cabo la inferencia y el aprendizaje en redes bayesianas.señales del habla o secuencias de proteínas) son llamadas redes bayesianas dinámicas.donde los nombres de las variables han sido abreviados a G = Hierba húmeda, S = Rociador activado, y R = Lloviendo.Un camino de puestra trasera es uno que termina con una flecha hacia X.Los conjuntos que satisfacen el criterio de puerta trasera son llamados "suficientes" o "admisibles".Una ventaja de las redes bayesianas es que es intuitivamente más fácil para un ser humano comprender (un conjunto escaso de) dependencias directas y distribuciones locales que la distribución conjunta completa.Hay tres tareas principales de inferencia para las redes bayesianas.Los métodos más comunes de inferencia exactas son: eliminación de variables, el cual elimina (mediante integración o suma) las variables no observadas y no consultadas una por una mediante la distribución de la suma sobre el producto; propagación en un árbol clique, que almacena en caché el cálculo de modo que muchas variables se pueden consultar en una vez y nueva evidencia se puede propagar rápidamente; y condicionamiento recursivo y búsqueda AND/OR, que permiten un equilibrio espacio-tiempo y realiza eficientemente la eliminación de variables cuando se usa suficiente espacio.Todos estos métodos tienen una complejidad que es exponencial con respecto al ancho del árbol.Los algoritmos de inferencia aproximada más comunes son muestreo de importancia, simulación estocástica MCMC (Markov Chain Monte Carlo), eliminación mini-cubo, LBP (Loopy Belief Propagation), GBP (Generalized Belief Propagation), y los métodos variacionales.(Análogamente, en el contexto específico de una red bayesiana dinámica, una que comúnmente especifica la distribución condicional para la evolución temporal del estado ocultos para maximizar la tasa de entropía del proceso estocástico implícito) A menudo, estas distribuciones condicionales incluyen parámetros que son desconocidos y deben estimarse a partir de los datos, a veces utilizando el enfoque de máxima probabilidad.Un enfoque más Bayesiano es tratar a los parámetros como variables no observadas adicionales y para calcular la distribución posterior completa sobre todos los nodos condicionales de los datos observados, después, integrar los parámetros.En otras aplicaciones, la tarea de definir la red es demasiado compleja para los seres humanos.Tipo 3, sin embargo, puede ser identificado de forma única, ya queSe han desarrollado algoritmos para determinar sistemáticamente el esqueleto del grafo subyacente y, a continuación, orientar todas las flechas cuya direccionalidad está dictada por las independencias condicionales observados.[8]​[9]​ habla acerca del uso de la información mutua entre las variables y encontrar una estructura que maximiza esto.Lo hacen mediante la restricción del conjunto de padres candidatos a k nodos y exhaustivamente buscan en el mismo.se requiere, lo que resulta en una probabilidad posterior Este es el ejemplo más simple de un modelo jerárquico Bayesiano.individuales han sido extraídos de una distribución subyacente, a continuación, esta relación destruye la independencia y sugiere un modelo más complejo, por ejemplo, con previos inapropiadosindividual tenderá a moverse o reducir la distancia de máxima verosimilitud estimada hacia su media común.Los previos habituales, tales como los previos de Jeffrey a menudo no funcionan, debido a que la distribución posterior será incorrecta (no normalizable), y estimaciones realizadas por reducir al mínimo la pérdida esperada será inadmisible .Esto también se puede expresar en términos similares a la primera definición, como Tenga en cuenta que el conjunto de los padres es un subconjunto del conjunto de los no descendientes porque el grafo es acíclico.Si U y V no son d-separados, se les llama d-conectado.A veces el término se reserva para los modelos con tres o más niveles de las variables aleatorias, en otras ocasiones, se reserva para los modelos con variables latentes.En general, sin embargo, cualquier red Bayesiana moderadamente compleja suele llamarse "jerárquica".Aunque las redes Bayesianas se utilizan a menudo para representar relaciones causales, esto no tiene por qué ser el caso: una arista dirigida de u a v no requiere que Xv sea causalmente dependiente de Xu.El término "redes bayesianas" fue acuñado por Judea Pearl en 1985 para hacer hincapié en tres aspectos:[25]​ A finales de 1980 los textos seminales Razonamiento Probabilístico en Sistemas Inteligentes[27]​ y Razonamiento Probabilístico en Sistemas Expertos[28]​ resume las propiedades de las redes Bayesianas y ayudó a establecer las mismas como un campo de estudio.
Una red Bayesiana simple. Influencia de la lluvia si el rociador está activado e influencia de la lluvia y el rociador si la hierba se encuentra húmeda.
Ejemplo de una red bayesiana simple.
Todos los nodos dentro del círculo azul están dentro de la manta de markov de A
Todos los nodos dentro del círculo azul están dentro de la manta de markov de A