La arquitectura de datos consta de modelos, políticas, reglas y estándares que rigen qué datos se recopilan y cómo se almacenan, organizan, integran y utilizan en sistemas de datos y organizaciones. [1] Los datos suelen ser uno de varios dominios de arquitectura que forman los pilares de una arquitectura empresarial o de una arquitectura de solución . [2]
Una arquitectura de datos tiene como objetivo establecer estándares de datos para todos sus sistemas de datos como una visión o modelo de las posibles interacciones entre esos sistemas de datos. La integración de datos , por ejemplo, debería depender de los estándares de arquitectura de datos, ya que la integración de datos requiere interacciones de datos entre dos o más sistemas de datos. Una arquitectura de datos, en parte, describe las estructuras de datos utilizadas por una empresa y su software de aplicaciones informáticas . Las arquitecturas de datos abordan los datos almacenados, los datos en uso y los datos en movimiento; descripciones de almacenes de datos, grupos de datos y elementos de datos; y asignaciones de esos artefactos de datos a calidades de datos, aplicaciones, ubicaciones, etc.
Esencial para alcanzar el estado objetivo, la arquitectura de datos describe cómo se procesan, almacenan y utilizan los datos en un sistema de información . Proporciona criterios para las operaciones de procesamiento de datos para permitir diseñar flujos de datos y también controlar el flujo de datos en el sistema.
El arquitecto de datos suele ser responsable de definir el estado objetivo, alinearlo durante el desarrollo y luego realizar un seguimiento para garantizar que las mejoras se realicen según el espíritu del plan original.
Durante la definición del estado objetivo, la arquitectura de datos descompone un tema hasta el nivel atómico y luego lo reconstruye hasta la forma deseada. El arquitecto de datos analiza el tema pasando por tres etapas arquitectónicas tradicionales:
La columna "datos" del Marco Zachman para arquitectura empresarial –
En este segundo sentido, más amplio, la arquitectura de datos incluye un análisis completo de las relaciones entre las funciones de una organización, las tecnologías disponibles y los tipos de datos .
La arquitectura de datos debe definirse en la fase de planificación del diseño de un nuevo sistema de procesamiento y almacenamiento de datos. Los principales tipos y fuentes de datos necesarios para respaldar una empresa deben identificarse de manera completa, consistente y comprensible. El requisito principal en esta etapa es definir todas las entidades de datos relevantes, no especificar elementos de hardware informático . Una entidad de datos es cualquier cosa real o abstracta sobre la cual una organización o individuo desea almacenar datos.
La arquitectura de datos físicos de un sistema de información es parte de un plan tecnológico . El plan tecnológico se centra en los elementos tangibles reales que se utilizarán en la implementación del diseño de la arquitectura de datos . La arquitectura de datos físicos abarca la arquitectura de la base de datos. La arquitectura de la base de datos es un esquema de la tecnología de base de datos real que respaldaría la arquitectura de datos diseñada.
Ciertos elementos deben definirse durante la fase de diseño del esquema de arquitectura de datos. Por ejemplo, se debe describir una estructura administrativa que se va a establecer para gestionar los recursos de datos. Además, se deben definir las metodologías que se utilizarán para almacenar los datos. Además, se debe generar una descripción de la tecnología de base de datos a emplear, así como una descripción de los procesos que van a manipular los datos. También es importante diseñar interfaces para los datos de otros sistemas, así como un diseño para la infraestructura que respaldará las operaciones de datos comunes (es decir, procedimientos de emergencia, importaciones de datos , copias de seguridad de datos , transferencias externas de datos ).
Sin la guía de un diseño de arquitectura de datos implementado adecuadamente, las operaciones de datos comunes podrían implementarse de diferentes maneras, lo que dificultaría la comprensión y el control del flujo de datos dentro de dichos sistemas. Este tipo de fragmentación no es deseable debido al posible aumento de costos y a las desconexiones de datos involucradas. Este tipo de dificultades se pueden encontrar en empresas de rápido crecimiento y también en empresas que prestan servicios a diferentes líneas de negocios .
Si se ejecuta correctamente, la fase de arquitectura de datos de la planificación del sistema de información obliga a una organización a especificar y describir flujos de información tanto internos como externos. Estos son patrones que la organización tal vez no se haya tomado el tiempo de conceptualizar previamente. Por lo tanto, en esta etapa es posible identificar costosas deficiencias de información, desconexiones entre departamentos y sistemas organizacionales que pueden no haber sido evidentes antes del análisis de la arquitectura de datos. [4]
Varias limitaciones e influencias tendrán un efecto en el diseño de la arquitectura de datos. Estos incluyen requisitos empresariales, impulsores tecnológicos, economía, políticas comerciales y necesidades de procesamiento de datos.
{{cite book}}
: Mantenimiento CS1: ubicación ( enlace )