Maybaygiare.org

Blog Network

Modelado dimensional

Diseño del modeloeditar

El modelo dimensional se basa en un esquema similar a una estrella o un esquema de copo de nieve, con dimensiones que rodean la tabla de hechos. Para crear el esquema, se utiliza el siguiente modelo de diseño:

  1. Elegir el proceso de negocio
  2. Declarar el grano
  3. Identificar las dimensiones
  4. Identificar el hecho

Elegir el proceso de negocio

El proceso de modelado dimensional se basa en un método de diseño de 4 pasos que ayuda a garantizar la usabilidad del modelo dimensional y el uso del almacén de datos. Los conceptos básicos del diseño se basan en el proceso de negocio real que debe abarcar el almacén de datos. Por lo tanto, el primer paso en el modelo es describir el proceso de negocio en el que se basa el modelo. Esto podría ser, por ejemplo, una situación de ventas en una tienda minorista. Para describir el proceso de negocio, se puede elegir hacerlo en texto plano o usar la Notación básica de Modelado de Procesos de Negocio (BPMN) u otras guías de diseño como el Lenguaje de Modelado Unificado (UML).

Declarar el grano

Después de describir el proceso de negocio, el siguiente paso en el diseño es declarar el grano del modelo. El grano del modelo es la descripción exacta de en qué se debe enfocar el modelo dimensional. Esto podría ser, por ejemplo, «Un artículo individual en un recibo de cliente de una tienda minorista». Para aclarar lo que significa el grano, debe elegir el proceso central y describirlo con una oración. Además, el grano (oración) es de lo que vas a construir tu tabla de dimensiones y hechos. Es posible que sea necesario volver a este paso para alterar el grano debido a la nueva información obtenida sobre lo que se supone que su modelo puede entregar.

Identificar las dimensiones

El tercer paso en el proceso de diseño es definir las dimensiones del modelo. Las dimensiones deben definirse dentro del grano a partir del segundo paso del proceso de 4 pasos. Las dimensiones son la base de la tabla de hechos, y es donde se recopilan los datos de la tabla de hechos. Por lo general, las dimensiones son sustantivos como fecha, tienda, inventario, etc. Estas dimensiones son donde se almacenan todos los datos. Por ejemplo, la dimensión fecha podría contener datos como año, mes y día de la semana.

Identificar los hechos

Después de definir las dimensiones, el siguiente paso en el proceso es crear claves para la tabla de hechos. Este paso consiste en identificar los hechos numéricos que llenarán cada fila de la tabla de hechos. Este paso está estrechamente relacionado con los usuarios empresariales del sistema, ya que es aquí donde obtienen acceso a los datos almacenados en el almacén de datos. Por lo tanto, la mayoría de las filas de la tabla de hechos son cifras numéricas, aditivas, como cantidad o costo por unidad, etc.

Normalizacióneditar

La neutralidad de esta sección está en disputa. La discusión relevante se puede encontrar en la página de discusión. Por favor, no elimine este mensaje hasta que se cumplan las condiciones para hacerlo. (Junio de 2018) (Aprenda cómo y cuándo eliminar este mensaje de plantilla)

Normalización dimensional o copos de nieve elimina atributos redundantes, que se conocen en las dimensiones normalizadas planas normales. Las dimensiones se unen estrictamente en subdimensiones.

Los copos de nieve tienen una influencia en la estructura de datos que difiere de muchas filosofías de los almacenes de datos.Tabla de datos única (fact) rodeada de varias tablas descriptivas (de dimensiones)

Los desarrolladores a menudo no normalizan las dimensiones debido a varias razones:

  1. La normalización hace que la estructura de datos sea más compleja
  2. El rendimiento puede ser más lento, debido a las muchas uniones entre tablas
  3. El ahorro de espacio es mínimo
  4. No se pueden usar índices de mapa de bits
  5. Rendimiento de consultas. Las bases de datos 3NF sufren problemas de rendimiento al agregar o recuperar muchos valores dimensionales que pueden requerir análisis. Si solo va a hacer informes operativos, es posible que pueda sobrevivir con 3NF porque su usuario operativo estará buscando datos de grano muy fino.

Hay algunos argumentos sobre por qué la normalización puede ser útil. Puede ser una ventaja cuando parte de la jerarquía es común a más de una dimensión. Por ejemplo, una dimensión geográfica puede ser reutilizable porque tanto las dimensiones cliente como proveedor la utilizan.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.