Maybaygiare.org

Blog Network

Modellazione dimensionale

Progettazione del modelEdit

Il modello dimensionale è costruito su uno schema a stella o uno schema a fiocco di neve, con dimensioni che circondano la tabella dei fatti. Per costruire lo schema, il seguente modello di progettazione è utilizzato:

  1. Scegliere il processo di business
  2. Dichiara il grano
  3. Identificare le dimensioni
  4. Identificare il fatto

Scegliere il processo di business

Il processo di modellizzazione tridimensionale si basa su 4 fasi del metodo di progettazione che aiuta a garantire la fruibilità del modello dimensionale e l’utilizzo del data warehouse. Le basi nella progettazione si basano sul processo aziendale effettivo che il data warehouse dovrebbe coprire. Pertanto, il primo passo nel modello è descrivere il processo aziendale su cui si basa il modello. Questo potrebbe ad esempio essere una situazione di vendita in un negozio al dettaglio. Per descrivere il processo aziendale, è possibile scegliere di farlo in testo normale o utilizzare la notazione di modellazione dei processi aziendali di base (BPMN) o altre guide di progettazione come il linguaggio di modellazione unificato (UML).

Dichiarare il grano

Dopo aver descritto il processo di business, il passo successivo nella progettazione è quello di dichiarare il grano del modello. La grana del modello è la descrizione esatta di ciò su cui il modello dimensionale dovrebbe concentrarsi. Questo potrebbe ad esempio essere “Un singolo elemento pubblicitario su un foglio cliente da un negozio al dettaglio”. Per chiarire cosa significa il grano, dovresti scegliere il processo centrale e descriverlo con una frase. Inoltre, il grano (frase) è ciò da cui costruirai le tue dimensioni e la tabella dei fatti. Potresti trovare necessario tornare a questo passaggio per modificare la grana a causa di nuove informazioni acquisite su ciò che il tuo modello dovrebbe essere in grado di fornire.

Identificare le dimensioni

La terza fase del processo di progettazione consiste nella definizione delle dimensioni del modello. Le dimensioni devono essere definite all’interno della grana dalla seconda fase del processo in 4 fasi. Le dimensioni sono il fondamento della tabella dei fatti ed è dove vengono raccolti i dati per la tabella dei fatti. In genere le dimensioni sono nomi come data, negozio, inventario ecc. Queste dimensioni sono dove sono memorizzati tutti i dati. Ad esempio, la dimensione data potrebbe contenere dati quali anno, mese e giorno della settimana.

Identificare i fatti

Dopo aver definito le dimensioni, il passo successivo nel processo è quello di creare le chiavi per la tabella dei fatti. Questo passaggio consiste nell’identificare i fatti numerici che popoleranno ogni riga della tabella dei fatti. Questo passaggio è strettamente correlato agli utenti aziendali del sistema, poiché è qui che ottengono l’accesso ai dati memorizzati nel data warehouse. Pertanto, la maggior parte delle righe della tabella dei fatti sono cifre numeriche, additive come quantità o costo per unità, ecc.

Dimension NormalizationEdit

La neutralità di questa sezione è contestata. Una discussione pertinente può essere trovata nella pagina di discussione. Si prega di non rimuovere questo messaggio fino a quando le condizioni per farlo sono soddisfatte. (Giugno 2018) (Scopri come e quando rimuovere questo messaggio modello)

Normalizzazione dimensionale o fiocchi di neve rimuove gli attributi ridondanti, che sono noti nelle dimensioni normali appiattire de-normalizzate. Le dimensioni sono strettamente unite tra loro in sub dimensioni.

Snowflaking ha un’influenza sulla struttura dei dati che differisce da molte filosofie di data warehouse.Tabella di dati singoli (fact) circondata da più tabelle descrittive (dimension)

Gli sviluppatori spesso non normalizzano le dimensioni a causa di diversi motivi:

  1. La normalizzazione rende la struttura dei dati più complessa
  2. Le prestazioni possono essere più lente, a causa dei molti join tra le tabelle
  3. Il risparmio di spazio è minimo
  4. I database 3NF presentano problemi di prestazioni durante l’aggregazione o il recupero di molti valori dimensionali che potrebbero richiedere l’analisi. Se hai solo intenzione di fare report operativi, potresti essere in grado di cavartela con 3NF perché il tuo utente operativo cercherà dati a grana molto fine.

Ci sono alcuni argomenti sul perché la normalizzazione può essere utile. Può essere un vantaggio quando una parte della gerarchia è comune a più di una dimensione. Ad esempio, una dimensione geografica può essere riutilizzabile perché la utilizzano sia le dimensioni del cliente che quelle del fornitore.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.