Progettazione del modelEdit
Il modello dimensionale è costruito su uno schema a stella o uno schema a fiocco di neve, con dimensioni che circondano la tabella dei fatti. Per costruire lo schema, il seguente modello di progettazione è utilizzato:
- Scegliere il processo di business
- Dichiara il grano
- Identificare le dimensioni
- Identificare il fatto
Scegliere il processo di business
Il processo di modellizzazione tridimensionale si basa su 4 fasi del metodo di progettazione che aiuta a garantire la fruibilità del modello dimensionale e l’utilizzo del data warehouse. Le basi nella progettazione si basano sul processo aziendale effettivo che il data warehouse dovrebbe coprire. Pertanto, il primo passo nel modello è descrivere il processo aziendale su cui si basa il modello. Questo potrebbe ad esempio essere una situazione di vendita in un negozio al dettaglio. Per descrivere il processo aziendale, è possibile scegliere di farlo in testo normale o utilizzare la notazione di modellazione dei processi aziendali di base (BPMN) o altre guide di progettazione come il linguaggio di modellazione unificato (UML).
Dichiarare il grano
Dopo aver descritto il processo di business, il passo successivo nella progettazione è quello di dichiarare il grano del modello. La grana del modello è la descrizione esatta di ciò su cui il modello dimensionale dovrebbe concentrarsi. Questo potrebbe ad esempio essere “Un singolo elemento pubblicitario su un foglio cliente da un negozio al dettaglio”. Per chiarire cosa significa il grano, dovresti scegliere il processo centrale e descriverlo con una frase. Inoltre, il grano (frase) è ciò da cui costruirai le tue dimensioni e la tabella dei fatti. Potresti trovare necessario tornare a questo passaggio per modificare la grana a causa di nuove informazioni acquisite su ciò che il tuo modello dovrebbe essere in grado di fornire.
Identificare le dimensioni
La terza fase del processo di progettazione consiste nella definizione delle dimensioni del modello. Le dimensioni devono essere definite all’interno della grana dalla seconda fase del processo in 4 fasi. Le dimensioni sono il fondamento della tabella dei fatti ed è dove vengono raccolti i dati per la tabella dei fatti. In genere le dimensioni sono nomi come data, negozio, inventario ecc. Queste dimensioni sono dove sono memorizzati tutti i dati. Ad esempio, la dimensione data potrebbe contenere dati quali anno, mese e giorno della settimana.
Identificare i fatti
Dopo aver definito le dimensioni, il passo successivo nel processo è quello di creare le chiavi per la tabella dei fatti. Questo passaggio consiste nell’identificare i fatti numerici che popoleranno ogni riga della tabella dei fatti. Questo passaggio è strettamente correlato agli utenti aziendali del sistema, poiché è qui che ottengono l’accesso ai dati memorizzati nel data warehouse. Pertanto, la maggior parte delle righe della tabella dei fatti sono cifre numeriche, additive come quantità o costo per unità, ecc.
Dimension NormalizationEdit
Normalizzazione dimensionale o fiocchi di neve rimuove gli attributi ridondanti, che sono noti nelle dimensioni normali appiattire de-normalizzate. Le dimensioni sono strettamente unite tra loro in sub dimensioni.
Snowflaking ha un’influenza sulla struttura dei dati che differisce da molte filosofie di data warehouse.Tabella di dati singoli (fact) circondata da più tabelle descrittive (dimension)
Gli sviluppatori spesso non normalizzano le dimensioni a causa di diversi motivi:
- La normalizzazione rende la struttura dei dati più complessa
- Le prestazioni possono essere più lente, a causa dei molti join tra le tabelle
- Il risparmio di spazio è minimo
- I database 3NF presentano problemi di prestazioni durante l’aggregazione o il recupero di molti valori dimensionali che potrebbero richiedere l’analisi. Se hai solo intenzione di fare report operativi, potresti essere in grado di cavartela con 3NF perché il tuo utente operativo cercherà dati a grana molto fine.
Ci sono alcuni argomenti sul perché la normalizzazione può essere utile. Può essere un vantaggio quando una parte della gerarchia è comune a più di una dimensione. Ad esempio, una dimensione geografica può essere riutilizzabile perché la utilizzano sia le dimensioni del cliente che quelle del fornitore.