design af modelEdit
den dimensionelle model er bygget på et stjernelignende skema eller snefnugskema med dimensioner omkring faktatabellen. For at opbygge skemaet anvendes følgende designmodel:
- Vælg forretningsprocessen
- Angiv kornet
- Identificer dimensionerne
- Identificer faktum
Vælg forretningsprocessen
processen med dimensionel modellering bygger på en 4-trins designmetode, der hjælper med at sikre anvendeligheden af den dimensionelle model og brugen af datalageret. Det grundlæggende i designet bygger på den faktiske forretningsproces, som datalageret skal dække. Derfor er det første skridt i modellen at beskrive den forretningsproces, som modellen bygger på. Dette kan for eksempel være en salgssituation i en detailbutik. For at beskrive forretningsprocessen kan man vælge at gøre dette i almindelig tekst eller bruge basic Business Process Modeling Notation (BPMN) eller andre designguider som Unified Modeling Language (UML).
Angiv kornet
efter at have beskrevet forretningsprocessen er det næste trin i designet at erklære modelens korn. Modelens korn er den nøjagtige beskrivelse af, hvad den dimensionelle model skal fokusere på. Dette kan for eksempel være “en individuel linjepost på en kundeseddel fra en detailbutik”. For at præcisere, hvad kornet betyder, skal du vælge den centrale proces og beskrive den med en sætning. Desuden er kornet (sætningen) det, du skal bygge dine dimensioner og faktatabel ud fra. Du kan finde det nødvendigt at gå tilbage til dette trin for at ændre kornet på grund af nye oplysninger, der er opnået om, hvad din model skal kunne levere.
Identificer dimensionerne
det tredje trin i designprocessen er at definere modelens dimensioner. Dimensionerne skal defineres inden for kornet fra det andet trin i 4-trins processen. Dimensioner er grundlaget for faktatabellen, og det er her dataene til faktatabellen indsamles. Dimensioner er typisk navneord som dato, butik, lager osv. Disse dimensioner er, hvor alle data er gemt. Datodimensionen kan f.eks. indeholde data som År, Måned og ugedag.
Identificer fakta
efter at have defineret dimensionerne er det næste trin i processen at lave nøgler til faktatabellen. Dette trin er at identificere de numeriske fakta, der vil udfylde hver faktatabelrække. Dette trin er tæt knyttet til forretningsbrugerne af systemet, da det er her, de får adgang til data, der er gemt i datalageret. Derfor er de fleste af faktatabelrækkerne numeriske, additive tal såsom mængde eller pris pr.
Dimension Normaliseringredit
dimensionel normalisering eller snefnugningfjerner overflødige attributter, som er kendt i de normale flade de-normaliserede dimensioner. Dimensioner er strengt sammenføjet i underdimensioner.
snefnug har indflydelse på datastrukturen, der adskiller sig fra mange filosofier af datalagre.Enkelt data (fakta) tabel omgivet af flere beskrivende (dimension) tabeller
udviklere normaliserer ofte ikke dimensioner på grund af flere grunde:
- normalisering gør datastrukturen mere kompleks
- ydeevne kan være langsommere på grund af de mange sammenføjninger mellem tabeller
- pladsbesparelserne er minimale
- Bitmapindekser kan ikke bruges
- Forespørgselsydelse. 3NF-databaser lider af ydeevneproblemer, når de aggregerer eller henter mange dimensionelle værdier, der muligvis kræver analyse. Hvis du kun skal lave operationelle rapporter, kan du muligvis klare dig med 3NF, fordi din operationelle bruger vil være på udkig efter meget fine korndata.
Der er nogle argumenter for, hvorfor normalisering kan være nyttig. Det kan være en fordel, når en del af hierarkiet er fælles for mere end en dimension. For eksempel kan en geografisk dimension være genanvendelig, fordi både kunde-og leverandørdimensioner bruger den.