Un data mart es una estructura/patrón de acceso específico para entornos de almacenamiento de datos , que se utiliza para recuperar datos de cara al cliente. El data mart es un subconjunto del data warehouse y suele estar orientado a una línea de negocio o equipo específico. Mientras que los almacenes de datos tienen una profundidad que abarca toda la empresa, la información en los mercados de datos pertenece a un solo departamento. En algunas implementaciones, cada departamento o unidad de negocio se considera propietario de su data mart, incluido todo el hardware , software y datos . [1] Esto permite a cada departamento aislar el uso, manipulación y desarrollo de sus datos. En otras implementaciones donde se utilizan dimensiones conformadas, el propietario de esta unidad de negocios no será válido para dimensiones compartidas como cliente, producto, etc.
Los almacenes y los mercados de datos se construyen porque la información de la base de datos no está organizada de manera que sea fácilmente accesible. Esta organización requiere consultas demasiado complicadas, de difícil acceso o que requieren muchos recursos.
Mientras que las bases de datos transaccionales están diseñadas para actualizarse, los almacenes de datos o mercados son de solo lectura . Los almacenes de datos están diseñados para acceder a grandes grupos de registros relacionados. Los data marts mejoran el tiempo de respuesta del usuario final al permitirles tener acceso al tipo específico de datos que necesitan ver con más frecuencia, al proporcionar los datos de una manera que respalde la visión colectiva de un grupo de usuarios.
Un data mart es básicamente una versión condensada y más enfocada de un almacén de datos que refleja las regulaciones y especificaciones de procesos de cada unidad de negocios dentro de una organización. [2] Cada mercado de datos está dedicado a una función comercial o región específica. Este subconjunto de datos puede abarcar muchas o todas las áreas temáticas funcionales de una empresa. Es común que se utilicen múltiples data marts para satisfacer las necesidades de cada unidad de negocio individual (se pueden usar diferentes data marts para obtener información específica para varios departamentos de la empresa, como contabilidad, marketing, ventas, etc.).
El término relacionado spreadmart es un peyorativo que describe la situación que ocurre cuando uno o más analistas de negocios desarrollan un sistema de hojas de cálculo vinculadas para realizar un análisis de negocios y luego lo hacen crecer hasta un tamaño y grado de complejidad que lo hace casi imposible de mantener. El término para esta condición es "Excel Hell". [3]
Almacén de datos:
Mercado de datos:
Según la escuela de almacenamiento de datos de Inmon , un data mart dependiente es un subconjunto lógico ( vista ) o un subconjunto físico (extracto) de un almacén de datos más grande , aislado por una de las siguientes razones:
Según la escuela de almacenamiento de datos de Inmon, las desventajas inherentes a los data marts incluyen escalabilidad limitada , duplicación de datos , inconsistencia de datos con otros silos de información e incapacidad para aprovechar las fuentes de datos empresariales.
La escuela alternativa de almacenamiento de datos es la de Ralph Kimball . En su opinión, un data warehouse no es más que la unión de todos los data marts. Esta visión ayuda a reducir costos y proporciona un desarrollo rápido, pero puede crear un almacén de datos inconsistente, especialmente en organizaciones grandes. Por lo tanto, el enfoque de Kimball es más adecuado para pequeñas y medianas empresas. [4]