En la ciencia de la información , el análisis formal de conceptos ( FCA ) es una forma basada en principios de derivar una jerarquía de conceptos u ontología formal a partir de una colección de objetos y sus propiedades . Cada concepto de la jerarquía representa los objetos que comparten un conjunto de propiedades; y cada subconcepto de la jerarquía representa un subconjunto de los objetos (así como un superconjunto de las propiedades) en los conceptos superiores. El término fue introducido por Rudolf Wille en 1981 y se basa en la teoría matemática de los retículos y los conjuntos ordenados que fue desarrollada por Garrett Birkhoff y otros en la década de 1930.
El análisis de conceptos formales encuentra aplicaciones prácticas en campos que incluyen la minería de datos , la minería de texto , el aprendizaje automático , la gestión del conocimiento , la web semántica , el desarrollo de software , la química y la biología .
La motivación original del análisis de conceptos formales fue la búsqueda del significado del mundo real de la teoría del orden matemático . Una de esas posibilidades de naturaleza muy general es que las tablas de datos se pueden transformar en estructuras algebraicas llamadas retículos completos , y que estas se pueden utilizar para la visualización e interpretación de datos. Una tabla de datos que representa una relación heterogénea entre objetos y atributos, tabulando pares de la forma "el objeto g tiene el atributo m ", se considera un tipo de datos básico. Se lo conoce como contexto formal . En esta teoría, un concepto formal se define como un par ( A , B ), donde A es un conjunto de objetos (llamado extensión ) y B es un conjunto de atributos (la intención ) tal que
De esta manera, el análisis de conceptos formales formaliza las nociones semánticas de extensión e intensión .
Los conceptos formales de cualquier contexto formal pueden, como se explica a continuación, ordenarse en una jerarquía denominada, de manera más formal, el "entramado de conceptos" del contexto. El enrejado de conceptos puede visualizarse gráficamente como un "diagrama lineal", que puede resultar útil para comprender los datos. Sin embargo, a menudo estos enrejados se vuelven demasiado grandes para su visualización. En ese caso, la teoría matemática del análisis de conceptos formales puede resultar útil, por ejemplo, para descomponer el enrejado en partes más pequeñas sin pérdida de información, o para incrustarlo en otra estructura que sea más fácil de interpretar.
La teoría en su forma actual se remonta a principios de la década de 1980 y a un grupo de investigación dirigido por Rudolf Wille , Bernhard Ganter y Peter Burmeister en la Universidad Técnica de Darmstadt . Sin embargo, sus definiciones matemáticas básicas ya fueron introducidas en la década de 1930 por Garrett Birkhoff como parte de la teoría general de redes. Otras aproximaciones anteriores a la misma idea surgieron de varios grupos de investigación franceses, pero el grupo de Darmstadt normalizó el campo y elaboró sistemáticamente tanto su teoría matemática como sus fundamentos filosóficos. Estos últimos se refieren en particular a Charles S. Peirce , pero también a la lógica de Port-Royal .
En su artículo "Reestructurando la teoría de celosías" (1982), [1] iniciando el análisis de conceptos formales como disciplina matemática, Wille parte de un descontento con la teoría de celosías actual y las matemáticas puras en general: La producción de resultados teóricos —a menudo logrados mediante "elaboradas gimnasias mentales"— era impresionante, pero las conexiones entre dominios vecinos, incluso partes de una teoría, se estaban debilitando.
La reestructuración de la teoría reticular es un intento de revitalizar las conexiones con nuestra cultura general interpretando la teoría de la manera más concreta posible y, de esta manera, promover una mejor comunicación entre los teóricos reticulares y los usuarios potenciales de la teoría reticular.
—Rudolf Wille, [1]
Este objetivo se remonta al pedagogo Hartmut von Hentig, quien en 1972 abogó por la reestructuración de las ciencias con vistas a una mejor enseñanza y con el fin de hacer que las ciencias estuvieran mutuamente disponibles y fueran más generalmente (es decir, también sin conocimiento especializado) criticables. [2] Por lo tanto, por sus orígenes, el análisis conceptual formal apunta a la interdisciplinariedad y al control democrático de la investigación. [3]
Corrige el punto de partida de la teoría de retículas durante el desarrollo de la lógica formal en el siglo XIX. Entonces, y más tarde en la teoría de modelos , un concepto como predicado unario había sido reducido a su extensión. Ahora, nuevamente, la filosofía de los conceptos debe volverse menos abstracta al considerar la intención. Por lo tanto, el análisis de conceptos formales se orienta hacia las categorías de extensión e intención de la lingüística y la lógica conceptual clásica. [4]
El análisis formal de conceptos apunta a la claridad de los conceptos según la máxima pragmática de Charles S. Peirce , desplegando propiedades elementales observables de los objetos subsumidos . [3] En su filosofía tardía, Peirce asumió que el pensamiento lógico apunta a percibir la realidad , mediante la tríada concepto, juicio y conclusión . Las matemáticas son una abstracción de la lógica, desarrollan patrones de realidades posibles y, por lo tanto, pueden apoyar la comunicación racional . Sobre este trasfondo, Wille define:
El objetivo y el significado del Análisis de Conceptos Formales como teoría matemática de conceptos y jerarquías de conceptos es apoyar la comunicación racional de los seres humanos mediante el desarrollo matemático de estructuras conceptuales apropiadas que puedan activarse lógicamente.
—Rudolf Wille, [5]
Los datos del ejemplo se tomaron de un estudio de campo semántico, en el que se categorizaron sistemáticamente diferentes tipos de cuerpos de agua según sus atributos. [6] Para este propósito se ha simplificado.
La tabla de datos representa un contexto formal , el diagrama de líneas que se encuentra junto a ella muestra su red conceptual . A continuación se presentan las definiciones formales.
El diagrama de líneas anterior consta de círculos, segmentos de línea de conexión y etiquetas. Los círculos representan conceptos formales . Las líneas permiten leer la jerarquía de subconceptos y superconceptos. Cada nombre de objeto y atributo se utiliza como etiqueta exactamente una vez en el diagrama, con los objetos debajo y los atributos encima de los círculos de conceptos. Esto se hace de manera que se pueda llegar a un atributo desde un objeto a través de una ruta ascendente si y solo si el objeto tiene el atributo.
En el diagrama mostrado, por ejemplo, el objeto reservorio tiene los atributos estancado y constante , pero no los atributos temporal, corriente, natural, marítimo . En consecuencia, charco tiene exactamente las características temporal, estancado y natural .
El contexto formal original se puede reconstruir a partir del diagrama etiquetado, así como de los conceptos formales. La extensión de un concepto consiste en aquellos objetos desde los cuales un camino ascendente conduce al círculo que representa el concepto. La intención consiste en aquellos atributos hacia los cuales hay un camino ascendente desde ese círculo de conceptos (en el diagrama). En este diagrama, el concepto inmediatamente a la izquierda de la etiqueta reservorio tiene la intención estancado y natural y la extensión charco, maar, lago, estanque, tarn, piscina, laguna y mar .
Un contexto formal es un triple K = ( G , M , I ) , donde G es un conjunto de objetos , M es un conjunto de atributos e I ⊆ G × M es una relación binaria llamada incidencia que expresa qué objetos tienen qué atributos. [4] Para los subconjuntos A ⊆ G de objetos y los subconjuntos B ⊆ M de atributos, se definen dos operadores de derivación de la siguiente manera:
La aplicación de un operador de derivación y luego el otro constituye dos operadores de cierre :
Los operadores de derivación definen una conexión de Galois entre conjuntos de objetos y de atributos. Por eso, en francés, a la red de conceptos se la denomina a veces treillis de Galois (red de Galois).
Con estos operadores de derivación, Wille dio una definición elegante de un concepto formal: un par ( A , B ) es un concepto formal de un contexto ( G , M , I ) siempre que:
De manera equivalente y más intuitiva, ( A , B ) es un concepto formal precisamente cuando:
Para propósitos computacionales, un contexto formal puede ser representado naturalmente como una matriz (0,1) K en la que las filas corresponden a los objetos, las columnas corresponden a los atributos, y cada entrada k i , j es igual a 1 si "el objeto i tiene el atributo j ". En esta representación matricial, cada concepto formal corresponde a una submatriz máxima (no necesariamente contigua) cuyos elementos son todos iguales a 1. Sin embargo, es engañoso considerar un contexto formal como booleano , porque la incidencia negada ("el objeto g no tiene el atributo m ") no forma conceptos de la misma manera que se definió anteriormente. Por esta razón, los valores 1 y 0 o VERDADERO y FALSO se evitan usualmente cuando se representan contextos formales, y se usa un símbolo como × para expresar la incidencia.
Los conceptos ( A i , B i ) de un contexto K pueden ordenarse (parcialmente) por la inclusión de extensiones o, equivalentemente, por la inclusión dual de intenciones. Un orden ≤ en los conceptos se define de la siguiente manera: para dos conceptos cualesquiera ( A 1 , B 1 ) y ( A 2 , B 2 ) de K , decimos que ( A 1 , B 1 ) ≤ ( A 2 , B 2 ) precisamente cuando A 1 ⊆ A 2 . Equivalentemente, ( A 1 , B 1 ) ≤ ( A 2 , B 2 ) siempre que B 1 ⊇ B 2 .
En este orden, cada conjunto de conceptos formales tiene un máximo común subconcepto o superconcepto, cuya extensión está formada por aquellos objetos que son comunes a todas las extensiones del conjunto. Dualmente , cada conjunto de conceptos formales tiene un mínimo común superconcepto , cuya intención comprende todos los atributos que tienen todos los objetos de ese conjunto de conceptos.
Estas operaciones de encuentro y unión satisfacen los axiomas que definen un retículo , de hecho un retículo completo . A la inversa, se puede demostrar que todo retículo completo es el retículo conceptual de algún contexto formal (salvo isomorfismo).
Los datos del mundo real suelen presentarse en forma de tabla de atributos de objetos, donde los atributos tienen "valores". El análisis conceptual formal maneja dichos datos transformándolos en el tipo básico de un contexto formal ("univaluado"). El método se denomina escalamiento conceptual .
La negación de un atributo m es un atributo ¬ m , cuya extensión es justamente el complemento de la extensión de m , es decir, con (¬ m ) ′ = G \ m ′ . En general, no se supone que los atributos negados estén disponibles para la formación de conceptos. Pero los pares de atributos que son negaciones entre sí a menudo ocurren naturalmente, por ejemplo en contextos derivados del escalamiento conceptual.
Para posibles negaciones de conceptos formales, consulte la sección álgebras de conceptos a continuación.
Una implicación A → B relaciona dos conjuntos A y B de atributos y expresa que cada objeto que posee cada atributo de A también tiene cada atributo de B . Cuando ( G , M , I ) es un contexto formal y A , B son subconjuntos del conjunto M de atributos (es decir, A,B ⊆ M ), entonces la implicación A → B es válida si A ′ ⊆ B ′ . Para cada contexto formal finito, el conjunto de todas las implicaciones válidas tiene una base canónica , [7] un conjunto irredundante de implicaciones del cual todas las implicaciones válidas pueden derivarse por inferencia natural ( reglas de Armstrong ). Esto se utiliza en la exploración de atributos , un método de adquisición de conocimiento basado en implicaciones. [8]
El análisis de conceptos formales tiene fundamentos matemáticos elaborados, [4] lo que hace que el campo sea versátil. Como ejemplo básico mencionamos las relaciones de flecha , que son simples y fáciles de calcular, pero muy útiles. Se definen de la siguiente manera: Para g ∈ G y m ∈ M sea
y doblemente
Dado que sólo se pueden relacionar pares de objetos y atributos que no son incidentes, estas relaciones se pueden registrar de manera conveniente en la tabla que representa un contexto formal. Muchas propiedades de la red se pueden extraer de las relaciones de flecha, incluida la distributividad y varias de sus generalizaciones. También revelan información estructural y se pueden utilizar para determinar, por ejemplo, las relaciones de congruencia de la red.
El análisis conceptual temporal (TCA) es una extensión del análisis conceptual formal (FCA) que apunta a una descripción conceptual de fenómenos temporales. Proporciona animaciones en redes conceptuales obtenidas a partir de datos sobre objetos cambiantes. Ofrece una forma general de comprender el cambio de objetos concretos o abstractos en un espacio y tiempo continuo, discreto o híbrido. El TCA aplica escalamiento conceptual a bases de datos temporales. [14]
En el caso más simple, el TCA considera objetos que cambian en el tiempo como una partícula en física, que, en cada momento, está exactamente en un lugar. Esto sucede en aquellos datos temporales donde los atributos 'objeto temporal' y 'tiempo' juntos forman una clave de la base de datos. Luego, el estado (de un objeto temporal en un momento en una vista) se formaliza como un cierto concepto de objeto del contexto formal que describe la vista elegida. En este caso simple, una visualización típica de un sistema temporal es un diagrama de líneas de la red de conceptos de la vista en la que se insertan las trayectorias de los objetos temporales. [15]
El TCA generaliza el caso mencionado anteriormente al considerar bases de datos temporales con una clave arbitraria. Esto conduce a la noción de objetos distribuidos que se encuentran en un momento dado en posiblemente muchos lugares, como por ejemplo una zona de alta presión en un mapa meteorológico. Las nociones de "objetos temporales", "tiempo" y "lugar" se representan como conceptos formales en escalas. Un estado se formaliza como un conjunto de conceptos de objetos. Esto conduce a una interpretación conceptual de las ideas de partículas y ondas en física. [16]
Existen varios algoritmos simples y rápidos para generar conceptos formales y para construir y navegar en redes de conceptos. Para una descripción general, consulte Kuznetsov y Obiedkov [17] o el libro de Ganter y Obiedkov, [8] donde también se puede encontrar algo de pseudocódigo. Dado que la cantidad de conceptos formales puede ser exponencial en relación con el tamaño del contexto formal, la complejidad de los algoritmos generalmente se da con respecto al tamaño de salida. Las redes de conceptos con unos pocos millones de elementos se pueden manejar sin problemas.
En la actualidad, existen muchas aplicaciones de software FCA. [18] El objetivo principal de estas herramientas varía desde la creación de contextos formales hasta la minería de conceptos formales y la generación de la red de conceptos de un contexto formal determinado y las correspondientes implicaciones y reglas de asociación . La mayoría de estas herramientas son aplicaciones académicas de código abierto, como:
Un contexto formal puede interpretarse naturalmente como un grafo bipartito . Los conceptos formales corresponden entonces a las biclínica máximas en ese grafo. Los resultados matemáticos y algorítmicos del análisis de conceptos formales pueden utilizarse así para la teoría de las biclínica máximas. La noción de dimensión bipartita (del grafo bipartito complementado) se traduce [4] en la de dimensión de Ferrers (del contexto formal) y de dimensión de orden (de la red de conceptos) y tiene aplicaciones, por ejemplo, para la factorización de matrices booleanas. [25]
Dada una tabla numérica de datos de objeto-atributo, el objetivo de la biagrupación es agrupar algunos objetos que tengan valores similares de algunos atributos. Por ejemplo, en los datos de expresión genética, se sabe que los genes (objetos) pueden compartir un comportamiento común solo para un subconjunto de situaciones biológicas (atributos): en consecuencia, se deben producir patrones locales para caracterizar los procesos biológicos, estos últimos posiblemente deberían superponerse, ya que un gen puede estar involucrado en varios procesos. La misma observación se aplica a los sistemas de recomendación donde uno está interesado en patrones locales que caractericen a grupos de usuarios que comparten fuertemente casi los mismos gustos por un subconjunto de elementos. [26]
Un bicluster en una tabla de datos binaria de objetos y atributos es un par (A,B) que consiste en un conjunto de objetos A de máxima inclusión y un conjunto de atributos B de máxima inclusión, de modo que casi todos los objetos de A tienen casi todos los atributos de B y viceversa.
Por supuesto, los conceptos formales pueden considerarse como biclusters "rígidos" donde todos los objetos tienen todos los atributos y viceversa. Por lo tanto, no es sorprendente que algunas definiciones de biclusters que surgen de la práctica [27] sean solo definiciones de un concepto formal. [28] Las versiones relajadas basadas en FCA de biclustering y triclustering incluyen OA-biclustering [29] y OAC-triclustering [30] (aquí O representa objeto, A atributo, C condición); para generar patrones, estos métodos usan operadores primos solo una vez que se aplican a una sola entidad (por ejemplo, objeto) o un par de entidades (por ejemplo, atributo-condición), respectivamente.
Un bicluster de valores similares en una tabla numérica de datos de objetos y atributos se define habitualmente [31] [32] [33] como un par que consiste en un conjunto de objetos de máxima inclusión y un conjunto de atributos de máxima inclusión que tienen valores similares para los objetos. Un par de este tipo se puede representar como un rectángulo de máxima inclusión en la tabla numérica, módulo permutaciones de filas y columnas. En [28] se demostró que los biclusters de valores similares corresponden a triconceptos de un contexto triádico donde la tercera dimensión está dada por una escala que representa valores de atributos numéricos por atributos binarios.
Este hecho se puede generalizar al caso n -dimensional, donde los clústeres n -dimensionales de valores similares en datos n -dimensionales se representan mediante conceptos n+1 -dimensionales. Esta reducción permite utilizar definiciones y algoritmos estándar del análisis de conceptos multidimensionales [33] [10] para calcular clústeres multidimensionales.
En la teoría de los espacios de conocimiento se supone que en cualquier espacio de conocimiento la familia de estados de conocimiento está cerrada por unión. Por lo tanto, los complementos de los estados de conocimiento forman un sistema de cierre y pueden representarse como las extensiones de algún contexto formal.
El análisis de conceptos formales se puede utilizar como un método cualitativo para el análisis de datos. Desde los inicios del FCA a principios de la década de 1980, el grupo de investigación del FCA en la TU Darmstadt ha adquirido experiencia en más de 200 proyectos utilizando el FCA (a partir de 2005). [34] Incluidos los campos de: medicina y biología celular , [35] [36] genética , [37] [38] ecología , [39] ingeniería de software , [40] ontología , [41] ciencias de la información y bibliotecas , [42] [43] [44] administración de oficinas , [45] derecho , [46] [47] lingüística , [48] ciencia política . [49]
Muchos más ejemplos se describen, por ejemplo, en: Formal Concept Analysis. Foundations and Applications , [34] artículos de conferencias en congresos regulares como: International Conference on Formal Concept Analysis (ICFCA), [50] Concept Lattices and their Applications (CLA), [51] o International Conference on Conceptual Structures (ICCS). [52]
{{citation}}
: Mantenimiento de CS1: ubicación ( enlace )