stringtranslate.com

Modelado de datos

El proceso de modelado de datos. La figura ilustra la forma en que se desarrollan y utilizan los modelos de datos en la actualidad. Se desarrolla un modelo de datos conceptual basado en los requisitos de datos para la aplicación que se está desarrollando, quizás en el contexto de un modelo de actividad . El modelo de datos normalmente constará de tipos de entidades, atributos, relaciones, reglas de integridad y las definiciones de esos objetos. Luego se utiliza como punto de partida para el diseño de la interfaz o de la base de datos. [1]

El modelado de datos en ingeniería de software es el proceso de creación de un modelo de datos para un sistema de información mediante la aplicación de ciertas técnicas formales. Puede aplicarse como parte de un concepto más amplio de ingeniería basada en modelos (MDE).

Descripción general

El modelado de datos es un proceso utilizado para definir y analizar los requisitos de datos necesarios para respaldar los procesos de negocio dentro del alcance de los sistemas de información correspondientes en las organizaciones. Por lo tanto, el proceso de modelado de datos involucra a modeladores de datos profesionales que trabajan en estrecha colaboración con las partes interesadas del negocio, así como con los usuarios potenciales del sistema de información.

Hay tres tipos diferentes de modelos de datos que se producen mientras se avanza desde los requisitos hasta la base de datos real que se utilizará para el sistema de información. [2] Los requisitos de datos se registran inicialmente como un modelo de datos conceptual que es esencialmente un conjunto de especificaciones tecnológicas independientes sobre los datos y se utiliza para discutir los requisitos iniciales con las partes interesadas del negocio. Luego, el modelo conceptual se traduce en un modelo de datos lógico , que documenta las estructuras de los datos que se pueden implementar en las bases de datos. La implementación de un modelo de datos conceptual puede requerir múltiples modelos de datos lógicos. El último paso en el modelado de datos es transformar el modelo de datos lógico en un modelo de datos físico que organiza los datos en tablas y tiene en cuenta los detalles de acceso, rendimiento y almacenamiento. El modelado de datos define no sólo los elementos de datos, sino también sus estructuras y las relaciones entre ellos. [3]

Las técnicas y metodologías de modelado de datos se utilizan para modelar datos de una manera estándar, consistente y predecible con el fin de gestionarlos como un recurso. Se recomienda encarecidamente el uso de estándares de modelado de datos para todos los proyectos que requieran un medio estándar para definir y analizar datos dentro de una organización, por ejemplo, utilizando modelado de datos:

El modelado de datos se puede realizar durante varios tipos de proyectos y en múltiples fases de los proyectos. Los modelos de datos son progresivos; No existe un modelo de datos final para una empresa o aplicación. En cambio, un modelo de datos debe considerarse un documento vivo que cambiará en respuesta a un negocio cambiante. Lo ideal es que los modelos de datos se almacenen en un repositorio para que puedan recuperarse, ampliarse y editarse con el tiempo. Whitten et al. (2004) determinaron dos tipos de modelado de datos: [4]

El modelado de datos también se utiliza como técnica para detallar los requisitos comerciales de bases de datos específicas . A veces se le llama modelado de bases de datos porque eventualmente un modelo de datos se implementa en una base de datos. [4]

Temas

Modelos de datos

Cómo los modelos de datos ofrecen beneficios. [1]

Los modelos de datos proporcionan un marco para que los datos se utilicen dentro de los sistemas de información al proporcionar una definición y un formato específicos. Si un modelo de datos se utiliza de manera consistente en todos los sistemas, entonces se puede lograr la compatibilidad de los datos. Si se utilizan las mismas estructuras de datos para almacenar y acceder a los datos, diferentes aplicaciones pueden compartir datos sin problemas. Los resultados de esto se indican en el diagrama. Sin embargo, los sistemas y las interfaces suelen ser costosos de construir, operar y mantener. También pueden limitar el negocio en lugar de apoyarlo. Esto puede ocurrir cuando la calidad de los modelos de datos implementados en los sistemas e interfaces es deficiente. [1]

Algunos problemas comunes encontrados en los modelos de datos son:

Esquemas conceptuales, lógicos y físicos.

La arquitectura de tres niveles ANSI/SPARC. Esto muestra que un modelo de datos puede ser un modelo externo (o vista), un modelo conceptual o un modelo físico. Esta no es la única forma de examinar los modelos de datos, pero es una forma útil, especialmente al comparar modelos. [1]

En 1975, ANSI describió tres tipos de instancias de modelo de datos : [5]

Según ANSI, este enfoque permite que las tres perspectivas sean relativamente independientes entre sí. La tecnología de almacenamiento puede cambiar sin afectar ni el esquema lógico ni el conceptual. La estructura de tabla/columna puede cambiar sin afectar (necesariamente) el esquema conceptual. En cada caso, por supuesto, las estructuras deben permanecer consistentes en todos los esquemas del mismo modelo de datos.

Proceso de modelado de datos

Modelado de datos en el contexto de la integración de procesos de negocio . [6]

En el contexto de la integración de procesos de negocio (ver figura), el modelado de datos complementa el modelado de procesos de negocio y, en última instancia, da como resultado la generación de bases de datos. [6]

El proceso de diseño de una base de datos implica producir los tres tipos de esquemas descritos anteriormente: conceptual, lógico y físico. El diseño de la base de datos documentado en estos esquemas se convierte a través de un lenguaje de definición de datos , que luego se puede utilizar para generar una base de datos. Un modelo de datos totalmente atribuido contiene atributos detallados (descripciones) para cada entidad que lo contiene. El término "diseño de base de datos" puede describir muchas partes diferentes del diseño de un sistema de base de datos general . Principalmente, y más correctamente, se puede considerar como el diseño lógico de las estructuras de datos base utilizadas para almacenar los datos. En el modelo relacional estas son las tablas y las vistas . En una base de datos de objetos, las entidades y relaciones se asignan directamente a clases de objetos y relaciones con nombre. Sin embargo, el término "diseño de base de datos" también podría usarse para aplicarse al proceso general de diseño, no solo las estructuras de datos base, sino también los formularios y consultas utilizados como parte de la aplicación general de la base de datos dentro del Sistema de gestión de bases de datos o DBMS.

En el proceso, las interfaces del sistema representan entre el 25% y el 70% de los costos de desarrollo y soporte de los sistemas actuales. La razón principal de este costo es que estos sistemas no comparten un modelo de datos común . Si los modelos de datos se desarrollan sistema por sistema, entonces no sólo se repite el mismo análisis en áreas superpuestas, sino que se deben realizar análisis adicionales para crear las interfaces entre ellas. La mayoría de los sistemas dentro de una organización contienen los mismos datos básicos, redesarrollados para un propósito específico. Por lo tanto, un modelo de datos básico diseñado eficientemente puede minimizar el retrabajo con modificaciones mínimas para los diferentes sistemas dentro de la organización [1]

Metodologías de modelado

Los modelos de datos representan áreas de información de interés. Si bien existen muchas formas de crear modelos de datos, según Len Silverston (1997) [7] sólo destacan dos metodologías de modelado, de arriba hacia abajo y de abajo hacia arriba:

A veces, los modelos se crean mediante una combinación de los dos métodos: considerando las necesidades de datos y la estructura de una aplicación y haciendo referencia consistente a un modelo de área temática. En muchos entornos, la distinción entre un modelo de datos lógico y un modelo de datos físico es borrosa. Además, algunas herramientas CASE no distinguen entre modelos de datos lógicos y físicos . [7]

Diagramas entidad-relación

Ejemplo de diagramas entidad-relación IDEF1X utilizados para modelar el propio IDEF1X. El nombre de la vista es mm. También se proporcionan la jerarquía del dominio y las restricciones. Las restricciones se expresan como oraciones en la teoría formal del metamodelo. [8]

Existen varias notaciones para el modelado de datos. El modelo real se denomina con frecuencia "modelo entidad-relación", porque representa los datos en términos de las entidades y relaciones descritas en los datos . [4] Un modelo entidad-relación (ERM) es una representación conceptual abstracta de datos estructurados. El modelado entidad-relación es un método de modelado de bases de datos de esquema relacional , utilizado en ingeniería de software para producir un tipo de modelo de datos conceptual (o modelo de datos semántico ) de un sistema, a menudo una base de datos relacional , y sus requisitos de forma descendente .

Estos modelos se utilizan en la primera etapa del diseño del sistema de información durante el análisis de requisitos para describir las necesidades de información o el tipo de información que se almacenará en una base de datos . La técnica de modelado de datos se puede utilizar para describir cualquier ontología (es decir, una descripción general y clasificaciones de los términos utilizados y sus relaciones) para un determinado universo de discurso, es decir, un área de interés.

Se han desarrollado varias técnicas para el diseño de modelos de datos. Si bien estas metodologías guían a los modeladores de datos en su trabajo, dos personas diferentes que utilizan la misma metodología a menudo obtendrán resultados muy diferentes. Los más notables son:

Modelado de datos genéricos

Ejemplo de un modelo de datos genérico. [9]

Los modelos de datos genéricos son generalizaciones de modelos de datos convencionales . Definen tipos de relaciones generales estandarizados, junto con los tipos de cosas que pueden estar relacionadas mediante dicho tipo de relación. La definición de modelo de datos genérico es similar a la definición de lenguaje natural. Por ejemplo, un modelo de datos genérico puede definir tipos de relación como una "relación de clasificación", que es una relación binaria entre una cosa individual y un tipo de cosa (una clase), y una "relación parte-todo", que es una relación binaria entre dos cosas, una con función de parte, la otra con función de todo, independientemente del tipo de cosas que estén relacionadas.

Dada una lista extensible de clases, esto permite clasificar cualquier cosa individual y especificar relaciones parte-todo para cualquier objeto individual. Al estandarizar una lista extensible de tipos de relaciones, un modelo de datos genérico permite la expresión de un número ilimitado de tipos de hechos y se aproximará a las capacidades de los lenguajes naturales. Los modelos de datos convencionales, por otro lado, tienen un alcance de dominio fijo y limitado, porque la instanciación (uso) de dicho modelo sólo permite expresiones de tipos de hechos que están predefinidos en el modelo.

Modelado de datos semánticos

La estructura lógica de datos de un DBMS, ya sea jerárquica, de red o relacional, no puede satisfacer totalmente los requisitos para una definición conceptual de datos porque tiene un alcance limitado y está sesgada hacia la estrategia de implementación empleada por el DBMS. Esto es a menos que el modelo de datos semánticos se implemente en la base de datos a propósito, una elección que puede afectar levemente el rendimiento pero que generalmente mejora enormemente la productividad.

Modelos de datos semánticos. [8]

Por tanto, la necesidad de definir los datos desde una visión conceptual ha llevado al desarrollo de técnicas de modelado de datos semánticos . Es decir, técnicas para definir el significado de los datos dentro del contexto de sus interrelaciones con otros datos. Como se ilustra en la figura, el mundo real, en términos de recursos, ideas, eventos, etc., se define simbólicamente dentro de los almacenes de datos físicos. Un modelo de datos semántico es una abstracción que define cómo los símbolos almacenados se relacionan con el mundo real. Por tanto, el modelo debe ser una representación fiel del mundo real. [8]

El propósito del modelado de datos semánticos es crear un modelo estructural de una parte del mundo real, llamado "universo del discurso". Para ello se consideran cuatro relaciones estructurales fundamentales:

Un modelo de datos semántico se puede utilizar para muchos propósitos, como por ejemplo: [8]

El objetivo general de los modelos de datos semánticos es capturar más significado de los datos integrando conceptos relacionales con conceptos abstractos más poderosos conocidos en el campo de la inteligencia artificial . La idea es proporcionar primitivas de modelado de alto nivel como parte integral de un modelo de datos para facilitar la representación de situaciones del mundo real. [10]

Ver también

Referencias

  1. ^ abcdef Matthew West y Julian Fowler (1999). Desarrollo de modelos de datos de alta calidad Archivado el 9 de septiembre de 2020 en Wayback Machine . El Ejecutivo de Enlace Técnico STEP de las Industrias de Procesos Europeas (EPISTLE).
  2. ^ ab Simison, Graeme. C. y Witt, Graham. C. (2005). Conceptos básicos del modelado de datos . 3ra edición. Editores Morgan Kaufmann . ISBN  0-12-644551-6
  3. ^ Glosario de integración de datos Archivado el 20 de marzo de 2009 en Wayback Machine , Departamento de Transporte de EE. UU., agosto de 2001.
  4. ^ a b C Whitten, Jeffrey L .; Lonnie D. Bentley , Kevin C. Dittman . (2005). Métodos de análisis y diseño de sistemas . 6ta edición. ISBN 0-256-19906-X
  5. ^ Instituto Estadounidense de Estándares Nacionales. 1975. Grupo de estudio ANSI/X3/SPARC sobre sistemas de gestión de bases de datos; Informe provisional . FDT (Boletín de ACM SIGMOD) 7:2.
  6. ^ ab Paul R. Smith y Richard Sarfaty (1993). Creación de un plan estratégico para la gestión de la configuración utilizando herramientas de Ingeniería de Software Asistida por Computadora (CASE). Documento para 1993 Grupo Nacional de Usuarios de CAD/CAE de Contratistas e Instalaciones.
  7. ^ abcd Len Silverston, WHInmon, Kent Graziano (2007). El libro de recursos del modelo de datos . Wiley, 1997. ISBN 0-471-15364-8 . Revisado por Van Scott en tdan.com. Consultado el 1 de noviembre de 2008. 
  8. ^ Publicación abcd FIPS 184 Archivada el 3 de diciembre de 2013 en Wayback Machine , publicada de IDEF1X por el Laboratorio de sistemas informáticos del Instituto Nacional de Estándares y Tecnología (NIST). 21 de diciembre de 1993.
  9. ^ Amnón Shabo (2006). Estándares de datos de genómica clínica para farmacogenética y farmacogenómica Archivado el 22 de julio de 2009 en Wayback Machine .
  10. ^ "Modelado de datos semánticos" en: Metaclases y su aplicación . Serie de libros Apuntes de conferencias sobre informática. Editorial Springer Berlín/Heidelberg. Volumen Volumen 943/1995.

Otras lecturas

enlaces externos