Elementos de un DWH
Es de esperar que la estructura relacional de una base de datos operacional siga las formas normales de Codd en su diseño. En un DataWareHouse no debe seguirse ese patrón de diseño y se permite desnormalizar la información con el objetivo de optimizar las consultas.
Para identificar la información a tener en cuenta en el data warehouse, debemos identificar, en el seno de la organización, los procesos de negocio, las vistas para el proceso de negocio y las medidas cuan tificables asociadas a los mismos. De esta manera hablaremos de los siguientes elementos del data warehouse:
• Hechos: permiten representar los procesos de negocio de la organización. Por ejemplo, una venta puede identificarse como un proceso de negocio de manera que es factible, si corresponde en nuestra organización, considerar el hecho ventas.
• Dimensiones: permiten representar las distintas vistas para un cierto proceso de negocio (o los distintos puntos de vista desde los cuales se puede analizar). Si regresamos al ejemplo de una venta, podemos estudiarla a partir del cliente que la ha realizado, la fecha en la que se ha realizado, los productos que se han venido. Estos conceptos pueden ser considerados como vistas para este proceso de negocio. Puede ser interesante recuperar todas las compras realizadas por un cliente. Ello nos hace entender por qué la identificamos como una dimensión.
• Métricas: son los indicadores de negocio de un proceso de negocio, es decir, aquellos conceptos cuantificables que permiten medir un proceso de negocio. Están asociados a las tablas de hecho. Por ejemplo, en una venta tenemos el importe de la misma.
Existen principalmente dos tipos de esquemas para estructurar los datos en un almacén de datos:
• Esquema en estrella: permite estructurar la información de procesos, vistas y métricas mediante una estructura de estrella. A nivel de diseño, consiste en una tabla de hecho (también denominada a veces fact table) en el centro para el hecho objeto de análisis y una o varias tablas de dimensión por cada punto de vista de análisis que participa de la descripción de ese hecho. En la tabla de hecho encontramos los atributos destinados a medir (cuantificar): sus métricas. La tabla de hechos sólo presenta uniones con dimensiones.
• Esquema en copo de nieve: es un esquema de representación derivado del esquema en estrella, en el que las tablas de dimensión se normalizan en múltiples tablas. Por esta razón, la tabla de hechos deja de ser la única tabla del esquema que se relaciona con otras tablas, y aparecen nuevas uniones.
Debido a su importancia, creemos que es conveniente profundizar en los conceptos de tabla de hecho, dimensión y métrica.