Un data mart es una estructura/patrón de acceso específico para entornos de data warehouse , que se utiliza para recuperar datos de cara al cliente. El data mart es un subconjunto del data warehouse y suele estar orientado a una línea de negocio o equipo específico. Mientras que los data warehouses tienen una profundidad que abarca toda la empresa, la información de los data marts pertenece a un solo departamento. En algunas implementaciones, cada departamento o unidad de negocio se considera el propietario de su data mart, incluido todo el hardware , software y datos . [1] Esto permite que cada departamento aísle el uso, la manipulación y el desarrollo de sus datos. En otras implementaciones donde se utilizan dimensiones conformadas, este propietario de la unidad de negocio no será válido para dimensiones compartidas como cliente, producto, etc.
Los almacenes y los centros de datos se construyen porque la información de la base de datos no está organizada de manera que sea fácilmente accesible. Esta organización requiere consultas que son demasiado complicadas, de difícil acceso o que consumen muchos recursos.
Mientras que las bases de datos transaccionales están diseñadas para actualizarse, los almacenes de datos o marts son de solo lectura . Los almacenes de datos están diseñados para acceder a grandes grupos de registros relacionados. Los marts de datos mejoran el tiempo de respuesta del usuario final al permitir que los usuarios tengan acceso al tipo específico de datos que necesitan ver con más frecuencia, al proporcionar los datos de una manera que respalde la vista colectiva de un grupo de usuarios.
Un almacén de datos es básicamente una versión condensada y más enfocada de un almacén de datos que refleja las regulaciones y especificaciones de procesos de cada unidad de negocios dentro de una organización. [2] Cada almacén de datos está dedicado a una función o región de negocios específica. Este subconjunto de datos puede abarcar muchas o todas las áreas temáticas funcionales de una empresa. Es común que se utilicen múltiples almacenes de datos para satisfacer las necesidades de cada unidad de negocios individual (se pueden utilizar diferentes almacenes de datos para obtener información específica para varios departamentos de la empresa, como contabilidad, marketing, ventas, etc.).
El término relacionado spreadmart es un término peyorativo que describe la situación que se produce cuando uno o más analistas de negocios desarrollan un sistema de hojas de cálculo vinculadas para realizar un análisis de negocios y luego lo hacen crecer hasta un tamaño y grado de complejidad que lo hace casi imposible de mantener. El término para esta situación es "Excel Hell" [3] .
Almacén de datos:
Almacén de datos:
Según la escuela Inmon de almacenamiento de datos, un almacén de datos dependiente es un subconjunto lógico ( vista ) o un subconjunto físico (extracto) de un almacén de datos más grande , aislado por una de las siguientes razones:
Según la escuela Inmon de almacenamiento de datos, las desventajas inherentes a los almacenes de datos incluyen escalabilidad limitada , duplicación de datos , inconsistencia de datos con otros silos de información e incapacidad de aprovechar fuentes de datos empresariales.
La escuela alternativa de almacenamiento de datos es la de Ralph Kimball . En su opinión, un almacén de datos no es más que la unión de todos los depósitos de datos. Esta visión ayuda a reducir los costes y proporciona un desarrollo rápido, pero puede crear un almacén de datos inconsistente, especialmente en grandes organizaciones. Por lo tanto, el enfoque de Kimball es más adecuado para corporaciones pequeñas y medianas. [4]