Un modelo de datos semántico ( SDM ) es un formalismo de estructuración y descripción de bases de datos basado en semántica de alto nivel ( modelo de base de datos ) para bases de datos. Este modelo de base de datos está diseñado para capturar más del significado de un entorno de aplicación de lo que es posible con los modelos de bases de datos contemporáneos. Una especificación SDM describe una base de datos en términos de los tipos de entidades que existen en el entorno de aplicación, las clasificaciones y agrupaciones de esas entidades y las interconexiones estructurales entre ellas. SDM proporciona una colección de primitivas de modelado de alto nivel para capturar la semántica de un entorno de aplicación. Al acomodar la información derivada en una especificación estructural de base de datos, SDM permite que la misma información se vea de varias maneras; esto hace posible acomodar directamente la variedad de necesidades y requisitos de procesamiento que normalmente están presentes en las aplicaciones de bases de datos. El diseño del presente SDM se basa en nuestra experiencia en el uso de una versión preliminar del mismo. SDM está diseñado para mejorar la eficacia y la facilidad de uso de los sistemas de bases de datos. Una descripción de base de datos SDM puede servir como una herramienta de especificación y documentación formal para una base de datos; Puede proporcionar una base para soportar una variedad de potentes funciones de interfaz de usuario, puede servir como un modelo de base de datos conceptual en el proceso de diseño de bases de datos y puede usarse como modelo de base de datos para un nuevo tipo de sistema de administración de bases de datos.
Un modelo de datos semánticos en ingeniería de software tiene varios significados:
Normalmente, los datos de instancia de los modelos de datos semánticos incluyen explícitamente los tipos de relaciones entre los diversos elementos de datos, como <se encuentra en>. Para interpretar el significado de los hechos de las instancias, se requiere que se conozca el significado de los tipos de relaciones (tipos de relación). Por lo tanto, los modelos de datos semánticos normalmente estandarizan dichos tipos de relación. Esto significa que el segundo tipo de modelos de datos semánticos permite que las instancias expresen hechos que incluyen sus propios significados. El segundo tipo de modelos de datos semánticos suele estar destinado a crear bases de datos semánticas. La capacidad de incluir significado en bases de datos semánticas facilita la creación de bases de datos distribuidas que permiten a las aplicaciones interpretar el significado del contenido. Esto implica que las bases de datos semánticas se pueden integrar cuando utilizan los mismos tipos de relación (estándar). Esto también implica que, en general, tienen una aplicabilidad más amplia que las bases de datos relacionales u orientadas a objetos .
La estructura lógica de datos de un sistema de gestión de bases de datos (DBMS), ya sea jerárquica , de red o relacional , no puede satisfacer totalmente los requisitos de una definición conceptual de los datos, porque tiene un alcance limitado y está sesgada hacia la estrategia de implementación empleada por el DBMS. Por lo tanto, la necesidad de definir los datos desde una perspectiva conceptual ha llevado al desarrollo de técnicas de modelado semántico de datos. Es decir, técnicas para definir el significado de los datos dentro del contexto de sus interrelaciones con otros datos, como se ilustra en la figura. El mundo real, en términos de recursos, ideas, eventos, etc., se define simbólicamente dentro de los almacenes de datos físicos. Un modelo de datos semántico es una abstracción que define cómo los símbolos almacenados se relacionan con el mundo real. Por lo tanto, el modelo debe ser una verdadera representación del mundo real. [1]
Según Klas y Schrefl (1995), el "objetivo general de los modelos de datos semánticos es captar más significado de los datos mediante la integración de conceptos relacionales con conceptos de abstracción más potentes conocidos en el campo de la inteligencia artificial . La idea es proporcionar primitivas de modelado de alto nivel como parte integral de un modelo de datos para facilitar la representación de situaciones del mundo real". [2]
La necesidad de modelos de datos semánticos fue reconocida por primera vez por la Fuerza Aérea de los Estados Unidos a mediados de la década de 1970 como resultado del Programa de Fabricación Integrada Asistida por Computadora (ICAM). El objetivo de este programa era aumentar la productividad de la fabricación mediante la aplicación sistemática de la tecnología informática. El Programa ICAM identificó la necesidad de mejores técnicas de análisis y comunicación para las personas involucradas en la mejora de la productividad de la fabricación. Como resultado, el Programa ICAM desarrolló una serie de técnicas conocidas como Métodos IDEF (definición ICAM), que incluían lo siguiente: [1]
Durante la década de 1990, la aplicación de técnicas de modelado semántico dio lugar a los modelos de datos semánticos del segundo tipo. Un ejemplo de ellos es el modelo de datos semánticos que se estandarizó como ISO 15926-2 (2002), que se desarrolló posteriormente hasta convertirse en el lenguaje de modelado semántico Gellish (2005). La definición del lenguaje Gellish está documentada en forma de modelo de datos semánticos. Gellish en sí es un lenguaje de modelado semántico que se puede utilizar para crear otros modelos semánticos. Esos modelos semánticos se pueden almacenar en bases de datos Gellish, que son bases de datos semánticas.
Un modelo de datos semántico puede utilizarse para muchos propósitos. Algunos objetivos clave incluyen: [1]
Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.