A modell Tervezéseszerkesztés
a dimenziós modell csillagszerű sémára vagy hópehely sémára épül, a ténytáblát körülvevő dimenziókkal. A séma felépítéséhez a következő tervezési modellt kell használni:
- válassza ki az üzleti folyamatot
- deklarálja a gabonát
- határozza meg a dimenziókat
- határozza meg a tényt
válassza ki az üzleti folyamatot
a dimenziós modellezés folyamata egy 4 lépéses tervezési módszerre épül, amely segít biztosítani a dimenziós modell használhatóságát és az adattárház használatát. A tervezés alapjai a tényleges üzleti folyamatra épülnek, amelyre az adattárháznak ki kell terjednie. Ezért a modell első lépése annak az üzleti folyamatnak a leírása, amelyre a modell épül. Ez lehet például egy kiskereskedelmi üzlet értékesítési helyzete. Az üzleti folyamat leírásához választhatja ezt egyszerű szövegben, vagy használhatja az alapvető üzleti Folyamatmodellezési jelölést (BPMN) vagy más tervezési útmutatókat, például az Unified Modeling Language (UML).
deklarálja a gabonát
az üzleti folyamat leírása után a tervezés következő lépése a modell szemcséjének deklarálása. A modell szemcséje annak pontos leírása, hogy a dimenziós modellnek mire kell összpontosítania. Ez lehet például “egy kiskereskedelmi üzletből származó ügyfélcsúcs egyedi sora”. Annak tisztázása érdekében, hogy mit jelent a gabona, válassza ki a központi folyamatot, és írja le egy mondattal. Továbbá, a gabona (mondat) az, amiből felépíted a dimenziókat és a ténytáblázatot. Előfordulhat, hogy vissza kell térnie ehhez a lépéshez, hogy megváltoztassa a gabonát az új információk miatt, amelyeket a modell állítólag képes lesz szállítani.
A méretek azonosítása
a tervezési folyamat harmadik lépése a modell méreteinek meghatározása. A méreteket a gabonán belül kell meghatározni a 4 lépéses folyamat második lépésétől kezdve. A dimenziók képezik a ténytábla alapját, és itt gyűjtik össze a ténytábla adatait. A méretek általában olyan főnevek, mint a dátum, bolt, leltár stb. Ezekben a dimenziókban tárolják az összes adatot. A dátum dimenzió például olyan adatokat tartalmazhat, mint az év, a hónap és a hétköznap.
A tények azonosítása
a dimenziók meghatározása után a folyamat következő lépése az, hogy kulcsokat készítsen a ténytáblához. Ez a lépés azon numerikus tények azonosítása, amelyek feltöltik az egyes ténytáblák sorát. Ez a lépés szorosan kapcsolódik a rendszer üzleti felhasználóihoz, mivel itt férnek hozzá az adattárházban tárolt adatokhoz. Ezért a ténytáblázat sorainak többsége numerikus, additív szám, például mennyiség vagy egységenkénti költség stb.
Dimension NormalizationEdit
a dimenzió normalizálása vagy a hópehely eltávolítja a redundáns attribútumokat, amelyek a normál simítás normalizált dimenzióiban ismertek. A méretek szigorúan össze vannak kötve az alméretekben.
a hópehely hatással van az adatszerkezetre, amely különbözik az adattárházak sok filozófiájától.Egyetlen adat (tény) tábla körül több leíró (dimenzió) táblák
a fejlesztők gyakran nem normalizálják a dimenziókat több okból is:
- a normalizálás az adatszerkezetet összetettebbé teszi
- a teljesítmény lassabb lehet, A táblák közötti sok illesztés miatt
- a helymegtakarítás minimális
- Bitmap indexek nem használhatók
- lekérdezési teljesítmény. A 3NF adatbázisok teljesítményproblémákat szenvednek sok olyan dimenziós érték összesítésekor vagy lekérésekor, amelyek elemzést igényelhetnek. Ha csak operatív jelentéseket fog készíteni, akkor lehet, hogy megbirkózik a 3NF-rel, mert az operatív felhasználó nagyon finom szemcsés adatokat fog keresni.
van néhány érv, hogy miért normalizálás hasznos lehet. Előny lehet, ha a hierarchia egy része egynél több dimenzióra jellemző. Például egy földrajzi dimenzió újrafelhasználható lehet, mivel mind az ügyfél, mind a szállító dimenziói használják.