Un grafoide es un conjunto de enunciados de la forma " X es irrelevante para Y dado que conocemos Z ", donde X , Y y Z son conjuntos de variables. La noción de "irrelevancia" y "dado que conocemos" puede obtener diferentes interpretaciones, incluidas las probabilísticas , relacionales y correlacionales, según la aplicación. Estas interpretaciones comparten propiedades comunes que pueden capturarse mediante trayectorias en grafos (de ahí el nombre "grafoide"). La teoría de grafoides caracteriza estas propiedades en un conjunto finito de axiomas que son comunes a la irrelevancia informativa y sus representaciones gráficas.
Judea Pearl y Azaria Paz [1] acuñaron el término "grafoides" después de descubrir que un conjunto de axiomas que gobiernan la independencia condicional en la teoría de la probabilidad es compartido por los grafos no dirigidos . Las variables se representan como nodos en un grafo de tal manera que los conjuntos de variables X e Y son independientes condicionados a Z en la distribución siempre que el conjunto de nodos Z separe a X de Y en el grafo. Los axiomas para la independencia condicional en probabilidad fueron derivados anteriormente por A. Philip Dawid [2] y Wolfgang Spohn [3] . La correspondencia entre dependencia y grafos se extendió más tarde a los grafos acíclicos dirigidos (DAG) [4] [5] [6] y a otros modelos de dependencia. [1] [7]
Un modelo de dependencia M es un subconjunto de tripletes ( X , Z , Y ) para los cuales el predicado I ( X , Z , Y ): X es independiente de Y dado Z , es verdadero. Un grafoide se define como un modelo de dependencia que está cerrado bajo los siguientes cinco axiomas:
Un semigrafoide es un modelo de dependencia cerrado bajo los axiomas 1–4. Estos cinco axiomas en conjunto se conocen como axiomas de grafoide. [8] Intuitivamente, las propiedades de unión y contracción débiles significan que la información irrelevante no debería alterar el estado de relevancia de otras proposiciones en el sistema; lo que era relevante sigue siendo relevante y lo que era irrelevante sigue siendo irrelevante. [8]
Independencia condicional, definida como
es un semigrafoide que se convierte en un grafoide completo cuando P es estrictamente positivo. [1] [7]
Un modelo de dependencia es un grafoide correlacional si en alguna función de probabilidad tenemos,
donde es la correlación parcial entre x e y dado el conjunto Z.
En otras palabras, el error de estimación lineal de las variables en X utilizando mediciones en Z no se reduciría al agregar mediciones de las variables en Y , lo que hace que Y sea irrelevante para la estimación de X. Los modelos de dependencia correlacional y probabilística coinciden para distribuciones normales. [1] [7]
Un modelo de dependencia es un grafoide relacional si satisface
En otras palabras, el rango de valores permitidos para X no está restringido por la elección de Y , una vez que Z es fijo. Las declaraciones de independencia que pertenecen a este modelo son similares a las dependencias multivaloradas integradas (EMVD) en las bases de datos. [1] [7]
Si existe un grafo no dirigido G tal que,
Entonces, el grafoide se llama grafoinducido. En otras palabras, existe un grafo no dirigido G tal que cada enunciado de independencia en M se refleja como una separación de vértices en G y viceversa. Una condición necesaria y suficiente para que un modelo de dependencia sea un grafoide inducido es que satisfaga los siguientes axiomas: simetría, descomposición, intersección, unión fuerte y transitividad.
Un sindicato fuerte afirma que
La transitividad establece que
Los axiomas de simetría, descomposición, intersección, unión fuerte y transitividad constituyen una caracterización completa de los grafos no dirigidos. [9]
Un grafoide se denomina inducido por DAG si existe un grafo acíclico dirigido D tal que donde representa d -separación en D . d -separación ( d - connota "direccional") extiende la noción de separación de vértices de grafos no dirigidos a grafos acíclicos dirigidos. Permite la lectura de independencias condicionales a partir de la estructura de redes bayesianas . Sin embargo, las independencias condicionales en un DAG no pueden caracterizarse completamente mediante un conjunto finito de axiomas. [10]
Los grafoides inducidos por grafos y los inducidos por DAG están contenidos en grafoides probabilísticos. [11] Esto significa que para cada grafo G existe una distribución de probabilidad P tal que cada independencia condicional en P está representada en G , y viceversa. Lo mismo es cierto para los DAG. Sin embargo, hay distribuciones probabilísticas que no son grafoides y, además, no hay una axiomatización finita para las dependencias condicionales probabilísticas. [12]
Thomas Verma demostró que cada semigrafoide tiene una forma recursiva de construir un DAG en el que cada separación d es válida. [13] La construcción es similar a la utilizada en las redes de Bayes y es la siguiente:
El DAG creado por esta construcción representará todas las independencias condicionales que se desprenden de las utilizadas en la construcción. Además, cada separación d que se muestre en el DAG será una independencia condicional válida en el grafoide utilizado en la construcción.