stringtranslate.com

Tabla de hechos

Ejemplo de un esquema en estrella ; la tabla central es la tabla de hechos

En el almacenamiento de datos , una tabla de hechos consta de las mediciones, métricas o hechos de un proceso empresarial . Se encuentra en el centro de un esquema en estrella o en forma de copo de nieve rodeado de tablas de dimensiones . Cuando se utilizan varias tablas de hechos, estas se organizan como un esquema de constelación de hechos . Una tabla de hechos normalmente tiene dos tipos de columnas: las que contienen hechos y las que son una clave externa para las tablas de dimensiones. La clave principal de una tabla de hechos suele ser una clave compuesta que se compone de todas sus claves externas. Las tablas de hechos contienen el contenido del almacén de datos y almacenan diferentes tipos de medidas, como medidas aditivas, no aditivas y semiaditivas.

Las tablas de hechos proporcionan los valores (normalmente) aditivos que actúan como variables independientes mediante las cuales se analizan los atributos dimensionales. Las tablas de hechos suelen definirse por su grano . El grano de una tabla de hechos representa el nivel más atómico mediante el cual se pueden definir los hechos. El grano de una tabla de hechos de ventas se puede expresar como "volumen de ventas por día por producto por tienda". Por lo tanto, cada registro de esta tabla de hechos se define de forma única por un día, un producto y una tienda. Otras dimensiones pueden ser miembros de esta tabla de hechos (como la ubicación/región), pero estas no agregan nada a la singularidad de los registros de hechos. Estas "dimensiones afiliadas" permiten porciones adicionales de los hechos independientes, pero generalmente brindan información a un nivel de agregación más alto (una región contiene muchas tiendas).

Ejemplo

Si el proceso comercial son ventas, entonces la tabla de hechos correspondiente normalmente contendrá columnas que representan hechos sin procesar y agregaciones en filas como:

"Ventas diarias promedio" es una medida que se almacena en la tabla de hechos. La tabla de hechos también contiene claves externas de las tablas de dimensiones , donde se almacenan series temporales (por ejemplo, fechas) y otras dimensiones (por ejemplo, ubicación de la tienda, vendedor, producto).

Todas las claves externas entre las tablas de hechos y dimensiones deben ser claves sustitutas , no claves reutilizadas de datos operativos.

Tipos de medidas

Una tabla de hechos puede contener hechos a nivel de detalle o hechos que han sido agregados (las tablas de hechos que contienen hechos agregados a menudo se denominan tablas de resumen).

Se debe tener especial cuidado al manejar proporciones y porcentajes. Una buena regla de diseño [1] es no almacenar nunca porcentajes o proporciones en tablas de hechos, sino calcularlos únicamente en la herramienta de acceso a datos. Por lo tanto, solo se debe almacenar el numerador y el denominador en la tabla de hechos, que luego se pueden agregar y los valores almacenados agregados se pueden usar para calcular la proporción o el porcentaje en la herramienta de acceso a datos.

En el mundo real, es posible tener una tabla de hechos que no contenga medidas ni hechos. Estas tablas se denominan "tablas de hechos sin hechos" o " tablas de unión ".

Las tablas de hechos sin hechos se pueden utilizar para modelar relaciones de muchos a muchos o para capturar marcas de tiempo de eventos. [1]

Tipos de tablas de hechos

Hay cuatro eventos de medición fundamentales que caracterizan todas las tablas de hechos. [2]

Transaccional
Una tabla transaccional es la más básica y fundamental. El grano asociado con una tabla de hechos transaccionales se especifica generalmente como "una fila por línea en una transacción", por ejemplo, cada línea en un recibo. Por lo general, una tabla de hechos transaccionales contiene datos del nivel más detallado, lo que hace que tenga una gran cantidad de dimensiones asociadas a ella.
Instantáneas periódicas
La instantánea periódica, como su nombre lo indica, toma una "fotografía del momento", donde el momento podría ser cualquier período de tiempo definido, por ejemplo, un resumen del desempeño de un vendedor durante el mes anterior. Una tabla de instantáneas periódicas depende de la tabla transaccional, ya que necesita los datos detallados que se encuentran en la tabla de hechos transaccionales para poder ofrecer el resultado de desempeño elegido.
Acumulando instantáneas
Este tipo de tabla de hechos se utiliza para mostrar la actividad de un proceso que tiene un inicio y un final bien definidos, por ejemplo, el procesamiento de un pedido. Un pedido pasa por pasos específicos hasta que se procesa por completo. A medida que se completan los pasos para completar el pedido, se actualiza la fila asociada en la tabla de hechos. Una tabla de instantáneas acumulativa suele tener varias columnas de fecha, cada una de las cuales representa un hito en el proceso. Por lo tanto, es importante tener una entrada en la dimensión de fecha asociada que represente un marcador de posición para una fecha desconocida, ya que muchas de las fechas de los hitos son desconocidas en el momento de la creación de la fila.
Instantáneas temporales
Al aplicar la teoría de bases de datos temporales y técnicas de modelado, la tabla de hechos de instantáneas temporales [3] permite tener el equivalente de instantáneas diarias sin tener realmente instantáneas diarias. Introduce el concepto de intervalos de tiempo en una tabla de hechos, lo que permite ahorrar mucho espacio, optimizar el rendimiento y permitir que el usuario final tenga el equivalente lógico de la "foto del momento" en la que está interesado.

Pasos para diseñar una tabla de hechos

Un enfoque alternativo es el proceso de diseño de cuatro pasos descrito en Kimball: [1] seleccionar el proceso de negocio, declarar el grano, identificar las dimensiones e identificar los hechos.

Referencias

  1. ^ abc Kimball & Ross - El kit de herramientas para el almacenamiento de datos, 2.ª edición [Wiley 2002]
  2. ^ Kimball, Ralph (2008). El kit de herramientas del ciclo de vida del almacén de datos, 2.ª edición . Wiley. ISBN 978-0-470-14977-5.
  3. ^ Davide, Mauri. "Tabla de hechos de instantáneas temporales".