Gráfico de conocimiento

En la representación y el razonamiento del conocimiento , un gráfico de conocimiento es una base de conocimiento que utiliza un modelo o una topología de datos estructurados en gráficos para representar y operar sobre los datos . Los gráficos de conocimiento se utilizan a menudo para almacenar descripciones interconectadas de entidades (objetos, eventos, situaciones o conceptos abstractos) y, al mismo tiempo, codificar la semántica o las relaciones de forma libre subyacentes a estas entidades. ^[1]^[2]

Desde el desarrollo de la Web Semántica , los gráficos de conocimiento a menudo se han asociado con proyectos de datos abiertos vinculados , centrándose en las conexiones entre conceptos y entidades. ^[3]^[4] También se asocian históricamente y son utilizados por motores de búsqueda como Google , Bing , Yext y Yahoo ; motores de conocimiento y servicios de respuesta a preguntas como WolframAlpha , Siri de Apple y Amazon Alexa ; y redes sociales como LinkedIn y Facebook .

Los recientes avances en ciencia de datos y aprendizaje automático, en particular en redes neuronales gráficas y aprendizaje de representaciones, así como en aprendizaje automático, han ampliado el alcance de los gráficos de conocimiento más allá de su uso tradicional en motores de búsqueda y sistemas de recomendación. Se utilizan cada vez más en la investigación científica, con aplicaciones notables en campos como la genómica, la proteómica y la biología de sistemas. ^[5]

Historia

El término fue acuñado en 1972 por el lingüista austríaco Edgar W. Schneider , en una discusión sobre cómo construir sistemas de instrucción modulares para cursos. ^[6] A fines de la década de 1980, la Universidad de Groningen y la Universidad de Twente comenzaron conjuntamente un proyecto llamado Gráficos de conocimiento, centrado en el diseño de redes semánticas con aristas restringidas a un conjunto limitado de relaciones, para facilitar las álgebras en el gráfico . En las décadas posteriores, la distinción entre redes semánticas y gráficos de conocimiento se desdibujó.

Algunos de los primeros gráficos de conocimiento se centraban en temas específicos. En 1985 se fundó Wordnet , que capturaba relaciones semánticas entre palabras y significados, una aplicación de esta idea al lenguaje mismo. En 2005, Marc Wirk fundó Geonames para capturar relaciones entre diferentes nombres geográficos y localidades y entidades asociadas. En 1998, Andrew Edmonds de Science in Finance Ltd en el Reino Unido creó un sistema llamado ThinkBase que ofrecía razonamiento basado en lógica difusa en un contexto gráfico. ^[7]

En 2007, se fundaron DBpedia y Freebase como repositorios de conocimiento basados en grafos para conocimiento de uso general. DBpedia se centraba exclusivamente en datos extraídos de Wikipedia, mientras que Freebase también incluía una variedad de conjuntos de datos públicos. Ninguno de ellos se describía a sí mismo como un "grafo de conocimiento", sino que desarrollaba y describía conceptos relacionados.

En 2012, Google presentó su Knowledge Graph , ^[8] basándose en DBpedia y Freebase, entre otras fuentes. Más tarde incorporaron RDFa , Microdata , contenido JSON-LD extraído de páginas web indexadas, incluido el CIA World Factbook , Wikidata y Wikipedia . ^[8]^[9] Los tipos de entidad y relación asociados con este gráfico de conocimiento se han organizado aún más utilizando términos del vocabulario schema.org ^[10] . El Google Knowledge Graph se convirtió en un complemento exitoso para la búsqueda basada en cadenas dentro de Google, y su popularidad en línea hizo que el término se usara más comúnmente. ^[10]

Desde entonces, varias grandes multinacionales han publicitado el uso de sus gráficos de conocimiento, popularizando aún más el término. Entre ellas se encuentran Facebook, LinkedIn, Airbnb , Microsoft , Amazon , Uber y eBay . ^[11]

En 2019, el IEEE combinó sus conferencias internacionales anuales sobre "Gran conocimiento" y "Minería de datos y computación inteligente" en la Conferencia internacional sobre gráficos de conocimiento. ^[12]

Definiciones

No existe una única definición comúnmente aceptada de un gráfico de conocimiento. La mayoría de las definiciones abordan el tema desde una perspectiva de Web semántica e incluyen estas características: ^[13]

Relaciones flexibles entre conocimientos en dominios temáticos : un gráfico de conocimiento (i) define clases abstractas y relaciones de entidades en un esquema, (ii) describe principalmente entidades del mundo real y sus interrelaciones, organizadas en un gráfico, (iii) permite interrelacionar potencialmente entidades arbitrarias entre sí, y (iv) cubre varios dominios temáticos. ^[14]
Estructura general : Una red de entidades, sus tipos semánticos, propiedades y relaciones. ^[15]^[16] Para representar propiedades, a menudo se utilizan valores categóricos o numéricos.
Apoyo al razonamiento sobre ontologías inferidas : un gráfico de conocimiento adquiere e integra información en una ontología y aplica un razonador para derivar nuevo conocimiento. ^[3]

Sin embargo, existen muchas representaciones de gráficos de conocimiento para las que algunas de estas características no son relevantes. Para esos gráficos de conocimiento, esta definición más simple puede resultar más útil:

Una estructura digital que representa el conocimiento en forma de conceptos y las relaciones entre ellos (hechos). Un gráfico de conocimiento puede incluir una ontología que permite tanto a los humanos como a las máquinas comprender y razonar sobre su contenido. ^[17]^[18]

Implementaciones

Además de los ejemplos anteriores, el término se ha utilizado para describir proyectos de conocimiento abierto como YAGO y Wikidata; federaciones como la nube Linked Open Data; ^{[19] una gama de herramientas de búsqueda comerciales, incluido el asistente de búsqueda semántica Spark de Yahoo,}Knowledge Graph de Google y Satori de Microsoft; y los gráficos de entidades de LinkedIn y Facebook. ^[3]

El término también se utiliza en el contexto de aplicaciones de software para tomar notas que permiten al usuario crear un gráfico de conocimiento personal . ^[20]

La popularización de los gráficos de conocimiento y sus métodos acompañantes han llevado al desarrollo de bases de datos de gráficos como Neo4j ^[21] y GraphDB. ^[22] Estas bases de datos de gráficos permiten a los usuarios almacenar fácilmente datos como entidades y sus interrelaciones, y facilitan operaciones como el razonamiento de datos, la incrustación de nodos y el desarrollo de ontologías en bases de conocimiento.

Uso de un gráfico de conocimiento para razonar sobre datos

Un gráfico de conocimiento representa formalmente la semántica al describir las entidades y sus relaciones. ^[23] Los gráficos de conocimiento pueden hacer uso de ontologías como una capa de esquema. Al hacer esto, permiten la inferencia lógica para recuperar conocimiento implícito en lugar de permitir únicamente consultas que soliciten conocimiento explícito. ^[24]

Para permitir el uso de gráficos de conocimiento en diversas tareas de aprendizaje automático, se han ideado varios métodos para derivar representaciones de características latentes de entidades y relaciones. Estas incrustaciones de gráficos de conocimiento permiten conectarlas con métodos de aprendizaje automático que requieren vectores de características como incrustaciones de palabras . Esto puede complementar otras estimaciones de similitud conceptual. ^[25]^[26]

Los modelos para generar incrustaciones útiles de grafos de conocimiento son comúnmente el dominio de las redes neuronales de grafos (GNN). ^[27] Las GNN son arquitecturas de aprendizaje profundo que comprenden bordes y nodos, que se corresponden bien con las entidades y relaciones de los grafos de conocimiento. La topología y las estructuras de datos que ofrecen las GNN proporcionan un dominio conveniente para el aprendizaje semisupervisado, en el que la red se entrena para predecir el valor de una incrustación de nodo (siempre que haya un grupo de nodos adyacentes y sus bordes) o borde (siempre que haya un par de nodos). Estas tareas sirven como abstracciones fundamentales para tareas más complejas, como el razonamiento y la alineación de grafos de conocimiento. ^[28]

Alineación de entidades

A medida que se producen nuevos gráficos de conocimiento en una variedad de campos y contextos, la misma entidad inevitablemente estará representada en múltiples gráficos. Sin embargo, debido a que no existe un estándar único para la construcción o representación de gráficos de conocimiento, determinar qué entidades de gráficos dispares corresponden al mismo tema del mundo real es una tarea no trivial. Esta tarea se conoce como alineación de entidades de gráficos de conocimiento y es un área activa de investigación. ^[29]

Las estrategias de alineación de entidades generalmente buscan identificar subestructuras similares, relaciones semánticas, atributos compartidos o combinaciones de los tres entre dos gráficos de conocimiento distintos. Los métodos de alineación de entidades utilizan estas similitudes estructurales entre gráficos generalmente no isomórficos para predecir qué nodos corresponden a la misma entidad. ^[30]

Los recientes éxitos de los modelos de lenguaje grandes (LLMs), en particular su eficacia para producir incrustaciones sintácticamente significativas, han estimulado el uso de LLMs en la tarea de alineación de entidades. ^[31]

A medida que crece la cantidad de datos almacenados en los gráficos de conocimiento, el desarrollo de métodos confiables para la alineación de entidades de los gráficos de conocimiento se convierte en un paso cada vez más crucial en la integración y cohesión de los datos de los gráficos de conocimiento.

Véase también

Mapa conceptual : diagrama que muestra las relaciones entre conceptos
Semántica formal (lenguaje natural) : estudio del significado en los lenguajes naturales.
Base de datos de gráficos : base de datos que utiliza gráficos matemáticos para almacenar y buscar datos.
Incorporación de gráficos de conocimiento : reducción de la dimensionalidad de objetos de datos semánticos basados en gráficos [tarea de aprendizaje automático]
Gráfico lógico : tipo de notación diagramática para lógica proposicional
Integración semántica : interrelación de información de diversas fuentes
Tecnología semántica : tecnología para ayudar a las máquinas a comprender los datos
Mapa de temas – Sistema de organización del conocimiento
Vadalog – Tipo de sistema de gestión de gráficos de conocimiento
YAGO (base de datos) – Repositorio de información de código abierto

Referencias

^ "¿Qué es un gráfico de conocimiento?". 2018.
^ "¿Qué define un gráfico de conocimiento?". 2020.
^ abc Ehrlinger, Lisa; Wöß, Wolfram (2016). Hacia una definición de los grafos de conocimiento (PDF) . SEMANTiCS2016. Leipzig: Actas conjuntas de la sección de pósteres y demostraciones de la 12.ª Conferencia internacional sobre sistemas semánticos – SEMANTiCS2016 y el 1.er taller internacional sobre cambio semántico y semántica en evolución (SuCCESS16). págs. 13–16.
^ Soylu, Ahmet (2020). "Mejorar la contratación pública en la Unión Europea mediante la construcción y explotación de un gráfico de conocimiento integrado". La web semántica – ISWC 2020 . Apuntes de clase en informática. Vol. 12507. págs. 430–446. doi :10.1007/978-3-030-62466-8_27. ISBN 978-3-030-62465-1. Número de identificación del sujeto 226229398.
^ Mohamed, Sameh K.; Nounu, Aayah; Nováček, Vít (2021). "Aplicaciones biológicas de modelos de incrustación de grafos de conocimiento". Briefings in Bioinformatics . 22 (2): 1679–1693. doi : 10.1093/bib/bbaa012 . hdl : 1983/919db5c6-6e10-4277-9ff9-f86bbcedcee8 . PMID 32065227 – vía Oxford Academic.
^ Edward W. Schneider. 1973. Modularización de cursos aplicada: el sistema de interfaz y sus implicaciones para el control de secuencias y el análisis de datos. En la Asociación para el Desarrollo de Sistemas Instruccionales (ADIS), Chicago, Illinois, abril de 1972
^ "Marca registrada de EE.UU. n.º 75589756".
^ ab Singhal, Amit (16 de mayo de 2012). "Presentación del gráfico de conocimiento: cosas, no cadenas". Blog oficial de Google . Consultado el 21 de marzo de 2017 .
^ Schwartz, Barry (17 de diciembre de 2014). "Google's Freebase To Close After Migrating To Wikidata: Knowledge Graph Impact?" [La base de datos Freebase de Google cerrará después de migrar a Wikidata: ¿impacto en el gráfico de conocimiento?"]. Mesa redonda sobre motores de búsqueda . Consultado el 10 de diciembre de 2017 .
^ ab McCusker, James P.; McGuiness, Deborah L. "¿Qué es un gráfico de conocimiento?". www.authorea.com . Consultado el 21 de marzo de 2017 .
^ "Empresas con gráficos de conocimiento". 2020.
^ "Conferencia internacional IEEE 2021 sobre gráficos de conocimiento (ICKG)*". KMedu Hub . 2017-07-09 . Consultado el 2021-03-22 .
^ Hogan, Aidan; Blomqvist, Eva; Cochez, Michael; d'Amato, Claudia; de Melo, Gerard; Gutiérrez, Claudio; Labra Gayo, José Emilio; Kirrane, Sabrina; Neumaier, Sebastián; Polléres, Axel; Navigli, Roberto; Ngonga Ngomo, Axel-Cyrille; Rashid, Sabbir M.; Rula, Anisa; Schmelzeisen, Lucas; Sequeda, Juan; Staab, Steffen; Zimmermann, Antoine (24 de enero de 2021). "Gráficos de conocimiento". Encuestas de Computación ACM . 54 (4): 1–37. arXiv : 2003.02320 . doi :10.1145/3447772. ISSN 0360-0300. Número de identificación del sujeto 235716181.
^ Paulheim, Heiko (2017). «Refinamiento de gráficos de conocimiento: un estudio de enfoques y métodos de evaluación» (PDF) . Web semántica : 489–508 . Consultado el 21 de marzo de 2017 .
^ Krötsch, Markus; Weikum, Gerhard (marzo de 2016). «Editorial del número especial sobre grafos de conocimiento». Journal of Web Semantics . 37–38: 53–54. doi :10.1016/j.websem.2016.04.002 . Consultado el 10 de febrero de 2021 .
^ "¿Qué es un grafo de conocimiento?|Ontotext". Ontotext . Consultado el 1 de julio de 2020 .
^ Peng, Ciyuan; Feng, Xia; Naseriparsa, Mehdi; Osborne, Francesco (2023). "Gráficos de conocimiento: oportunidades y desafíos". Revisión de inteligencia artificial . 56 (11): 13071–13102. arXiv : 2303.13948 . doi :10.1007/s10462-023-10465-9. ISSN 1573-7462. PMC 10068207 . PMID 37362886.
^ "El gráfico de conocimiento sobre los gráficos de conocimiento". 2020.
^ "La nube de datos abiertos vinculados". lod-cloud.net . Consultado el 30 de junio de 2020 .
^ Pyne, Yvette; Stewart, Stuart (marzo de 2022). «Metatrabajo: cómo investigamos es tan importante como lo que investigamos». British Journal of General Practice . 72 (716): 130–131. doi :10.3399/bjgp22X718757. PMC 8884432 . PMID 35210247.
^ "Base de datos y análisis de gráficos de Neo4j | Sistema de gestión de bases de datos de gráficos". Neo4j . Consultado el 8 de noviembre de 2023 .
^ "Ontotext GraphDB". Ontotext . Consultado el 8 de noviembre de 2023 .
^ "¿Cómo funcionan los gráficos de conocimiento?". Stardog . 2022-04-05 . Consultado el 2022-04-05 .
^ "Desbloquear el poder del panel de conocimiento de Google: cómo obtenerlo y reclamarlo en 2023 - RH Razu". rhrazu.com . 2023-09-01 . Consultado el 2023-09-05 .
^ Hongwei Wang (octubre de 2018). "RippleNet: propagación de las preferencias de los usuarios en el gráfico de conocimiento para sistemas de recomendación". Actas de la 27.ª Conferencia internacional de la ACM sobre gestión de la información y el conocimiento . págs. 417–426. arXiv : 1803.03467 . doi :10.1145/3269206.3271739. ISBN . 9781450360142.S2CID3766110 .
^ Ristoski, Petar; Paulheim, Heiko (2016), "RDF2Vec: incrustaciones de gráficos RDF para minería de datos" (PDF) , The Semantic Web – ISWC 2016 , Lecture Notes in Computer Science, vol. 9981, págs. 498–514, doi : 10.1007/978-3-319-46523-4_30 , ISBN 978-3-319-46522-7
^ Zhou, Jie; et al. (2020). "Redes neuronales de grafos: una revisión de métodos y aplicaciones". AI Open . 1 (1): 57–81. arXiv : 1812.08434 . doi : 10.1016/j.aiopen.2021.01.001 . S2CID 56517517 – vía Elsevier Science Direct.
^ Ye, Zi; Kumar, Yogan Jaya; Sing, Goh Ong; Song, Fengyan; Wang, Junsong (2022). "Un estudio exhaustivo de redes neuronales de grafos para grafos de conocimiento". IEEE Access . 10 : 75729–7574. Bibcode :2022IEEEA..1075729Y. doi : 10.1109/ACCESS.2022.3191784 . S2CID 250654689 – vía IEEE Xplore.
^ Berrendorf, Max; Faerman, Evgeniy; Melnychuk, Valentyn; Tresp, Volker; Seidl, Thomas (14-17 de abril de 2020). Alineación de entidades de grafos de conocimiento con redes convolucionales de grafos: lecciones aprendidas . Avances en recuperación de información: 42.ª Conferencia Europea sobre Investigación en RI, ECIR 2020, Lisboa, Portugal. Notas de clase en informática. Vol. Actas, Parte II. págs. 3-11. arXiv : 1911.08342 . doi :10.1007/978-3-030-45442-5_1. ISBN 978-3-030-45441-8. S2CID 208158314 – vía Springer International Publishing.
^ Chaurasiya, Deepak; Surisetty, Anil; Kumar, nitish; Singh, Alok; Dey, Vikrant; Malhotra, Aakarsh; Dhama, Gaurav; Arora, Ankur (2022). "Alineación de entidades para gráficos de conocimiento: avances, desafíos y estudios empíricos". arXiv : 2205.08777 [cs.AI].
^ Hogan, Aidan; Lippolis, Anna Sofia; Klironomos, Antonis; Milon-Flores, Daniela F.; Zheng, Heng; Jouglar, Alexane; Norouzi, Ebrahim (2023). "Mejora de la alineación de entidades entre Wikidata y ArtGraph mediante LLM" (PDF) . Actas del Taller internacional sobre diseño de ontología y web semántica para el patrimonio cultural , a través del Taller internacional sobre diseño de ontología y web semántica para el patrimonio cultural (SWODCH), Atenas, Grecia.

Enlaces externos

Will Douglas Heaven (4 de septiembre de 2020). "Esta IA sabelotodo aprende leyendo toda la web sin parar". MIT Technology Review . Consultado el 5 de septiembre de 2020. Diffbot está construyendo el gráfico de conocimiento más grande de la historia aplicando reconocimiento de imágenes y procesamiento de lenguaje natural a miles de millones de páginas web.

Scholia tiene un perfil de tema para Gráfico de conocimiento .