projektowanie modeluedit
model wymiarowy jest zbudowany na schemacie przypominającym gwiazdę lub płatka śniegu, z wymiarami otaczającymi tabelę faktów. Do zbudowania schematu wykorzystywany jest następujący model projektowy:
- Wybierz proces biznesowy
- Zadeklaruj ziarno
- Zidentyfikuj wymiary
- Zidentyfikuj fakt
Wybierz proces biznesowy
proces modelowania wymiarowego opiera się na 4-stopniowej metodzie projektowania, która pomaga zapewnić użyteczność modelu wymiarowego i wykorzystanie hurtowni danych. Podstawy projektowania opierają się na rzeczywistym procesie biznesowym, który powinna obejmować hurtownia danych. Dlatego pierwszym krokiem w modelu jest opisanie procesu biznesowego, na którym Model się opiera. Może to być na przykład sytuacja sprzedaży w sklepie detalicznym. Aby opisać proces biznesowy, można to zrobić w postaci zwykłego tekstu lub użyć podstawowej notacji modelowania procesów biznesowych (BPMN) lub innych przewodników projektowych, takich jak Unified Modeling Language (UML).
deklarowanie ziarna
po opisaniu procesu biznesowego, kolejnym krokiem w projekcie jest zadeklarowanie ziarna modelu. Ziarno modelu jest dokładnym opisem tego, na czym powinien się koncentrować model wymiarowy. Może to być na przykład „indywidualny element na poślizgu klienta ze sklepu detalicznego”. Aby wyjaśnić, co oznacza ziarno, powinieneś wybrać centralny proces i opisać go jednym zdaniem. Co więcej, ziarno (zdanie) jest tym, z czego zbudujesz swoje wymiary i tabelę faktów. Może okazać się konieczne, aby wrócić do tego kroku, aby zmienić ziarno ze względu na nowe informacje uzyskane na temat tego, co twój model ma być w stanie dostarczyć.
Identyfikacja wymiarów
trzecim krokiem w procesie projektowania jest zdefiniowanie wymiarów modelu. Wymiary muszą być zdefiniowane w ziarnie od drugiego etapu 4-stopniowego procesu. Wymiary są podstawą tabeli faktów i są miejscem gromadzenia danych dla tabeli faktów. Zazwyczaj wymiary są rzeczownikami, takimi jak data, magazyn, inwentarz itp. W tych wymiarach przechowywane są wszystkie dane. Na przykład wymiar daty może zawierać dane, takie jak rok, miesiąc i Dzień tygodnia.
Identyfikacja faktów
Po zdefiniowaniu wymiarów następnym krokiem w procesie jest utworzenie kluczy do tabeli faktów. Ten krok polega na zidentyfikowaniu liczbowych faktów, które będą wypełniać każdy wiersz tabeli faktów. Ten krok jest ściśle związany z użytkownikami biznesowymi systemu, ponieważ to tam uzyskują dostęp do danych przechowywanych w hurtowni danych. Dlatego większość wierszy tabeli faktów jest liczbowa, liczby dodatkowe, takie jak ilość lub koszt na jednostkę itp.
normalizacja wymiarów
normalizacja wymiarowa lub Płatek śniegu usuwa nadmiarowe atrybuty, które są znane w normalnych spłaszczonych wymiarach znormalizowanych. Wymiary są ściśle połączone ze sobą w podwymiarach.
Odśnieżanie ma wpływ na strukturę danych, która różni się od wielu filozofii hurtowni danych.Pojedyncza tabela danych otoczona wieloma tabelami opisowymi (wymiarowymi)
deweloperzy często nie normalizują wymiarów z kilku powodów:
- normalizacja sprawia, że struktura danych jest bardziej złożona
- wydajność może być wolniejsza, ze względu na wiele połączeń między tabelami
- oszczędność miejsca jest minimalna
- indeksy Bitmapowe nie mogą być używane
- wydajność zapytań. Bazy danych 3NF mają problemy z wydajnością podczas agregowania lub pobierania wielu wartości wymiarowych, które mogą wymagać analizy. Jeśli masz zamiar robić tylko raporty operacyjne, możesz być w stanie poradzić sobie z 3NF, ponieważ twój użytkownik operacyjny będzie szukał bardzo drobnych danych ziarnistych.
istnieją pewne argumenty, dlaczego normalizacja może być przydatna. Może to być zaletą, gdy część hierarchii jest wspólna dla więcej niż jednego wymiaru. Na przykład wymiar geograficzny może być wielokrotnego użytku, ponieważ używają go zarówno wymiary klienta, jak i dostawcy.