stringtranslate.com

Heterogeneidad semántica

La heterogeneidad semántica se produce cuando partes independientes desarrollan esquemas de bases de datos o conjuntos de datos para el mismo dominio, lo que da lugar a diferencias en el significado y la interpretación de los valores de los datos. [1] Más allá de los datos estructurados , el problema de la heterogeneidad semántica se agrava debido a la flexibilidad de los datos semiestructurados y los diversos métodos de etiquetado aplicados a documentos o datos no estructurados . La heterogeneidad semántica es una de las fuentes más importantes de diferencias en conjuntos de datos heterogéneos .

Sin embargo, para que múltiples fuentes de datos interoperen entre sí, es esencial conciliar estas diferencias semánticas . La descomposición de las diversas fuentes de heterogeneidades semánticas proporciona una base para comprender cómo mapear y transformar datos para superar estas diferencias.

Clasificación

Uno de los primeros esquemas de clasificación conocidos aplicados a la semántica de datos es de William Kent hace más de dos décadas. [2] El enfoque de Kent se ocupaba más de problemas de mapeo estructural que de diferencias de significado, lo que, según él, los diccionarios de datos podrían resolver.

Una de las clasificaciones más completas es la de Pluempitiwiriyawej y Hammer, "Esquema de clasificación para heterogeneidades semánticas y esquemáticas en fuentes de datos XML". [3] Clasifican las heterogeneidades en tres grandes clases:

Además, pueden producirse discrepancias o conflictos entre elementos del conjunto (una discrepancia de "población") o atributos (una discrepancia de "descripción").

Michael Bergman amplió este esquema agregando una cuarta categoría explícita importante de lenguaje y también agregó algunos ejemplos de cada tipo de heterogeneidad semántica, lo que resultó en alrededor de 40 categorías potenciales distintas [4] . [5] Esta tabla muestra las 40 posibles fuentes combinadas de heterogeneidades semánticas entre fuentes:

Sheth et al. adoptan un enfoque diferente hacia la clasificación de la semántica y los enfoques de integración . [6] Según su concepto, dividen la semántica en tres formas: implícita, formal y poderosa. La semántica implícita es la que está presente en gran medida o puede extraerse fácilmente; los lenguajes formales, aunque relativamente escasos, se presentan en forma de ontologías u otras lógicas de descripción ; y la semántica poderosa (suave) es confusa y no se limita a asignaciones rígidas basadas en conjuntos. El punto principal de Sheth et al. es que la lógica de primer orden (FOL) o la lógica de descripción es inadecuada por sí sola para capturar adecuadamente la semántica necesaria.

Aplicaciones relevantes

Además de la interoperabilidad de datos, las áreas relevantes de la tecnología de la información que dependen de la conciliación de heterogeneidades semánticas incluyen el mapeo de datos , la integración semántica y la integración de información empresarial , entre muchas otras. Desde los datos conceptuales hasta los reales, existen diferencias en perspectiva, vocabularios, medidas y convenciones una vez que se reúnen dos fuentes de datos. La atención explícita a estas heterogeneidades semánticas es un medio para lograr que la información se integre o interopere.

Hace apenas veinte años, los sistemas de tecnología de la información expresaban y almacenaban datos en multitud de formatos y sistemas. Internet y los protocolos web han hecho mucho para superar estas fuentes de diferencias. Si bien existe una gran cantidad de categorías de heterogeneidad semántica, estas categorías también están modeladas y pueden anticiparse y corregirse. Estas fuentes modeladas informan qué tipo de trabajo se debe hacer para superar las diferencias semánticas donde todavía residen.

Ver también

Referencias

  1. ^ Alon Halevy (2005). "Por qué sus datos no se mezclan". Cola . 3 (8).
  2. ^ William Kent (27 de febrero - 3 de marzo de 1989). Las múltiples formas de un solo hecho. Actas del IEEE COMPCON. San Francisco. 13 págs.
  3. ^ Charnyote Pluempitiwiriyawej y Joachim Hammer (septiembre de 2000). "Un esquema de clasificación para heterogeneidades semánticas y esquemáticas en fuentes de datos XML" (PDF) . Gainesville, Florida: Universidad de Florida. Informe Técnico TR00-004.
  4. ^ MK Bergman (6 de junio de 2006). "Fuentes y clasificación de heterogeneidades semánticas". AI3:::Información Adaptativa . Consultado el 28 de septiembre de 2014 .
  5. ^ MK Bergman (12 de agosto de 2014). "Gran estructura e interoperabilidad de datos". AI3:::Información Adaptativa . Consultado el 28 de septiembre de 2014 .
  6. ^ Amit P. Sheth; Cartic Ramakrishnan; Cristóbal Thomas (2005). "Semántica para la Web semántica: lo implícito, lo formal y lo poderoso". Revista Internacional sobre Web Semántica y Sistemas de Información . 1 (1): 1–18. doi :10.4018/jswis.2005010101.

Otras lecturas