stringtranslate.com

Esquema de estrella

En informática , el esquema en estrella o modelo en estrella es el estilo más simple de esquema de data mart y es el enfoque más utilizado para desarrollar almacenes de datos y data marts dimensionales. [1] El esquema en estrella consta de una o más tablas de hechos que hacen referencia a cualquier número de tablas de dimensiones . El esquema en estrella es un caso especial importante del esquema en copo de nieve y es más eficaz para manejar consultas más simples. [2]

El esquema de estrella recibe su nombre de la semejanza del modelo físico [3] con una forma de estrella con una tabla de hechos en su centro y las tablas de dimensiones a su alrededor que representan los puntos de la estrella.

Modelo

El esquema en estrella separa los datos de los procesos de negocio en hechos, que contienen datos cuantitativos mensurables sobre un negocio, y dimensiones, que son atributos descriptivos relacionados con los datos de hechos. Ejemplos de datos factuales incluyen el precio de venta, la cantidad de venta y las mediciones de tiempo, distancia, velocidad y peso. Los ejemplos de atributos de dimensión relacionados incluyen modelos de productos, colores de productos, tamaños de productos, ubicaciones geográficas y nombres de vendedores.

Un esquema de estrella que tiene muchas dimensiones a veces se denomina esquema de ciempiés . [4] Tener dimensiones de solo unos pocos atributos, aunque es más sencillo de mantener, genera consultas con muchas uniones de tablas y hace que el esquema en estrella sea menos fácil de usar.

Tablas de hechos

Las tablas de hechos registran medidas o métricas para un evento específico. Las tablas de hechos generalmente constan de valores numéricos y claves externas para datos dimensionales donde se guarda la información descriptiva. [4] Las tablas de hechos están diseñadas con un bajo nivel de detalle uniforme (lo que se conoce como "granularidad" o " grano "), lo que significa que los hechos pueden registrar eventos a un nivel muy atómico. Esto puede dar como resultado la acumulación de una gran cantidad de registros en una tabla de hechos a lo largo del tiempo. Las tablas de hechos se definen como uno de tres tipos:

A las tablas de hechos generalmente se les asigna una clave sustituta para garantizar que cada fila pueda identificarse de forma única. Esta clave es una clave primaria simple.

Tablas de dimensiones

Las tablas de dimensiones suelen tener una cantidad relativamente pequeña de registros en comparación con las tablas de hechos, pero cada registro puede tener una cantidad muy grande de atributos para describir los datos de hechos. Las dimensiones pueden definir una amplia variedad de características, pero algunos de los atributos más comunes definidos por las tablas de dimensiones incluyen:

A las tablas de dimensiones generalmente se les asigna una clave primaria sustituta , generalmente un tipo de datos entero de una sola columna, asignada a la combinación de atributos de dimensión que forman la clave natural.

Beneficios

Los esquemas en estrella están desnormalizados , lo que significa que las reglas típicas de normalización aplicadas a las bases de datos relacionales transaccionales se relajan durante el diseño y la implementación del esquema en estrella. Los beneficios de la desnormalización del esquema en estrella son:

Ejemplo

Esquema en estrella utilizado en la consulta de ejemplo.

Considere una base de datos de ventas, quizás de una cadena de tiendas, clasificadas por fecha, tienda y producto. La imagen del esquema de la derecha es una versión del esquema en estrella del esquema de muestra proporcionado en el artículo del esquema de copo de nieve .

Fact_Saleses la tabla de hechos y hay tablas de tres dimensiones Dim_Date, Dim_Storey Dim_Product.

Cada tabla de dimensiones tiene una clave principal en su Idcolumna, relacionada con una de las columnas (vistas como filas en el esquema de ejemplo) de Fact_Salesla clave principal (compuesta) de tres columnas de la tabla ( Date_Id, Store_Id, Product_Id). La columna de clave no principal Units_Soldde la tabla de hechos en este ejemplo representa una medida o métrica que se puede utilizar en cálculos y análisis. Las columnas de clave no principal de las tablas de dimensiones representan atributos adicionales de las dimensiones (como los Yearde la Dim_Datedimensión).

Por ejemplo, la siguiente consulta responde cuántos televisores se vendieron, para cada marca y país, en 1997:

SELECCIONAR P.Marca , S.País AS Países , SUMA ( F. Unidades_Vendidas )  FROM Fact_Sales F UNIÓN INTERNA Dim_Date D ON ( F. Date_Id = D. Id ) UNIÓN INTERNA Dim_Store S ON ( F. Store_Id = S. Id ) UNIÓN INTERNA Dim_Product P ON ( F. Product_Id = P. Id )                       DONDE D . Año = 1997 Y P . Categoría_Producto = 'televisión'       AGRUPAR POR P . Marca , S.País 

Ver también

Referencias

  1. ^ Dedić, N. y Stanier C., 2016., "Una evaluación de los desafíos del multilingüismo en el desarrollo del almacén de datos" en la 18.ª Conferencia internacional sobre sistemas de información empresarial - ICEIS 2016, p. 196.
  2. ^ DWH Schemas, 2009, archivado desde el original el 16 de julio de 2010
  3. ^ ", pág. 708
  4. ^ ab Ralph Kimball y Margy Ross, The Data Warehouse Toolkit: la guía completa para el modelado dimensional (segunda edición) , p. 393

enlaces externos