stringtranslate.com

Integración de datos basada en ontología

La integración de datos basada en ontologías implica el uso de una o más ontologías para combinar eficazmente datos o información de múltiples fuentes heterogéneas. [1] Es uno de los múltiples enfoques de integración de datos y puede clasificarse como Global-As-View (GAV). [2] La eficacia de la integración de datos basada en ontologías está estrechamente vinculada a la consistencia y expresividad de la ontología utilizada en el proceso de integración.

Fondo

Los datos de múltiples fuentes se caracterizan por múltiples tipos de heterogeneidad. A menudo se utiliza la siguiente jerarquía: [3] [4] [5]

Las ontologías , como modelos formales de representación con conceptos definidos explícitamente y relaciones nombradas que los vinculan, se utilizan para abordar la cuestión de la heterogeneidad semántica en las fuentes de datos. En dominios como la bioinformática y la biomedicina , el rápido desarrollo, adopción y disponibilidad pública de las ontologías [1] ha hecho posible que la comunidad de integración de datos las aproveche para la integración semántica de datos e información.

El papel de las ontologías

Las ontologías permiten la identificación inequívoca de entidades en sistemas de información heterogéneos y la afirmación de relaciones con nombres aplicables que conectan estas entidades entre sí. En concreto, las ontologías desempeñan las siguientes funciones:

Explicación del contenido
[1] La ontología permite una interpretación precisa de datos de múltiples fuentes a través de la definición explícita de términos y relaciones en la ontología.
Modelo de consulta
[1] En algunos sistemas como SIMS, [6] la consulta se formula utilizando la ontología como un esquema de consulta global.
Verificación
[1] La ontología verifica las asignaciones utilizadas para integrar datos de múltiples fuentes. Estas asignaciones pueden ser especificadas por el usuario o generadas por un sistema.

Enfoques que utilizan ontologías para la integración de datos

Hay tres arquitecturas principales que se implementan en aplicaciones de integración de datos basadas en ontología, [1] a saber,

Enfoque de ontología única
Se utiliza una única ontología como modelo de referencia global en el sistema. Este es el enfoque más simple, ya que puede simularse mediante otros enfoques. [1] SIMS [6] es un ejemplo destacado de este enfoque. El componente Structured Knowledge Source Integration de Research Cyc es otro ejemplo destacado de este enfoque. [7] [8] (Título = Aprovechar Cyc para responder a las consultas ad hoc de los investigadores clínicos). El Diccionario taxonómico de ontología de Gellish también sigue este enfoque. [9]
Ontologías múltiples
Para la integración se utilizan en combinación múltiples ontologías, cada una de las cuales modela una fuente de datos individual. Si bien este enfoque es más flexible que el de una sola ontología, requiere la creación de mapeos entre las múltiples ontologías. El mapeo de ontologías es un tema complejo y es el foco de una gran cantidad de esfuerzos de investigación en ciencias de la computación [2]. El sistema OBSERVER [10] es un ejemplo de este enfoque.
Enfoques híbridos
El enfoque híbrido implica el uso de múltiples ontologías que se adhieren a un vocabulario común de nivel superior. [11] El vocabulario de nivel superior define los términos básicos del dominio. Por lo tanto, el enfoque híbrido facilita el uso de múltiples ontologías para la integración en presencia del vocabulario común.

Véase también

Lectura adicional

Referencias

  1. ^ abcdef H. Wache; T. Vögele; U. Visser; H. Stuckenschmidt; G. Schuster; H. Neumann; S. Hübner (2001). Integración de información basada en ontologías: un estudio de los enfoques existentes . CiteSeerX 10.1.1.142.4390 . 
  2. ^ Maurizio Lenzerini (2002). Integración de datos: una perspectiva teórica (PDF) . págs. 243–246.
  3. ^ ab AP Sheth (1999). "Cambio de enfoque en la interoperabilidad en sistemas de información: desde el sistema, la sintaxis y la estructura hasta la semántica". Sistemas de información geográfica interoperables. MF Goodchild, MJ Egenhofer, R. Fegeas y CA Kottman (eds.), Kluwer Academic Publishers (PDF) . págs. 5–30.
  4. ^ Tutorial 5 de AHM02: Integración y mediación de datos; Colaboradores: B. Ludaescher, I. Altintas, A. Gupta, M. Martone, R. Marciano, X. Qian
  5. ^ "Tutorial 5 de AHM02: Integración y mediación de datos". users.sdsc.edu . Consultado el 23 de noviembre de 2017 .
  6. ^ ab Y. Arens; C. Hsu; CA Knoblock (1996). Procesamiento de consultas en el mediador de información de sims (PDF) .
  7. ^ "Integración de fuentes de conocimiento semántico | Cycorp". www.cyc.com . Archivado desde el original el 17 de mayo de 2014.
  8. ^ "Aprovechar Cyc para responder a las consultas ad hoc de los investigadores clínicos | Lenat | AI Magazine". Archivado desde el original el 2010-12-31 . Consultado el 2014-05-15 .
  9. ^ "Inicio". gellish.net .
  10. ^ E. Mena; V. Kashyap; A. Sheth; A. Illarramendi (1996). OBSERVER: Un enfoque para el procesamiento de consultas en sistemas de información global basado en la interoperación entre ontologías preexistentes (PDF) .
  11. ^ Cheng Hian Goh (1997). Representación y razonamiento sobre conflictos semánticos en sistemas de información heterogéneos (PDF) .

Enlaces externos