Maybaygiare.org

Blog Network

Dimensionsmodellierung

modelEdit entwerfen

Das Dimensionsmodell basiert auf einem sternförmigen Schema oder Schneeflockenschema mit Dimensionen, die die Faktentabelle umgeben. Um das Schema zu erstellen, wird das folgende Entwurfsmodell verwendet:

  1. Wählen Sie den Geschäftsprozess
  2. Deklarieren Sie das Korn
  3. Identifizieren Sie die Dimensionen
  4. Identifizieren Sie die Tatsache

Wählen Sie den Geschäftsprozess

Der Prozess der Dimensionsmodellierung basiert auf einer 4-stufigen Entwurfsmethode, die dazu beiträgt, die Verwendbarkeit des Dimensionsmodells und die Verwendung des Data Warehouse sicherzustellen. Die Grundlagen im Design bauen auf dem eigentlichen Geschäftsprozess auf, den das Data Warehouse abdecken soll. Daher besteht der erste Schritt im Modell darin, den Geschäftsprozess zu beschreiben, auf dem das Modell aufbaut. Dies könnte beispielsweise eine Verkaufssituation in einem Einzelhandelsgeschäft sein. Um den Geschäftsprozess zu beschreiben, können Sie dies im Klartext tun oder die grundlegende Business Process Modeling Notation (BPMN) oder andere Designleitfäden wie die Unified Modeling Language (UML) verwenden.

Körnung deklarieren

Nach der Beschreibung des Geschäftsprozesses besteht der nächste Schritt im Design darin, die Körnung des Modells zu deklarieren. Die Körnung des Modells ist die genaue Beschreibung dessen, worauf sich das Dimensionsmodell konzentrieren sollte. Dies könnte beispielsweise „Eine einzelne Werbebuchung auf einem Kundenzettel eines Einzelhandelsgeschäfts“ sein. Um zu verdeutlichen, was das Korn bedeutet, sollten Sie den zentralen Prozess auswählen und mit einem Satz beschreiben. Darüber hinaus ist das Korn (Satz) das, woraus Sie Ihre Dimensionen und Faktentabelle erstellen werden. Möglicherweise müssen Sie zu diesem Schritt zurückkehren, um das Korn aufgrund neuer Informationen darüber zu ändern, was Ihr Modell liefern soll.

Identifizieren der Abmessungen

Der dritte Schritt im Entwurfsprozess besteht darin, die Abmessungen des Modells zu definieren. Die Abmessungen müssen ab dem zweiten Schritt des 4-stufigen Prozesses innerhalb des Korns definiert werden. Dimensionen bilden die Grundlage der Faktentabelle und sind der Ort, an dem die Daten für die Faktentabelle gesammelt werden. Typischerweise sind Dimensionen Substantive wie Datum, Geschäft, Inventar usw. In diesen Dimensionen werden alle Daten gespeichert. Die Datumsdimension kann beispielsweise Daten wie Jahr, Monat und Wochentag enthalten.

Fakten identifizieren

Nach der Definition der Dimensionen besteht der nächste Schritt darin, Schlüssel für die Faktentabelle zu erstellen. In diesem Schritt werden die numerischen Fakten identifiziert, die jede Faktentabellenzeile füllen. Dieser Schritt ist eng mit den Geschäftsbenutzern des Systems verbunden, da sie hier Zugriff auf die im Data Warehouse gespeicherten Daten erhalten. Daher sind die meisten Faktentabellenzeilen numerische, additive Zahlen wie Menge oder Kosten pro Einheit usw.

Dimension NormalizationEdit

Die Neutralität dieses Abschnitts ist umstritten. Relevante Diskussionen finden Sie auf der Diskussionsseite. Bitte entfernen Sie diese Nachricht nicht, bis die Bedingungen dafür erfüllt sind. (Juni 2018) (Erfahren Sie, wie und wann diese Vorlage Nachricht entfernen)

Dimensional Normalisierung oder Snowflaking entfernt redundante Attribute, die in der normalen abflachen de-normalisierten Dimensionen bekannt sind. Abmessungen werden streng in Unterdimensionen zusammengefügt.

Snowflaking hat einen Einfluss auf die Datenstruktur, der sich von vielen Philosophien von Data Warehouses unterscheidet.Einzelne Datentabelle (Fact), umgeben von mehreren beschreibenden Tabellen (Dimensionstabellen)

Entwickler normalisieren Dimensionen häufig aus mehreren Gründen nicht:

  1. Die Normalisierung macht die Datenstruktur komplexer
  2. Die Leistung kann aufgrund der vielen Verknüpfungen zwischen Tabellen langsamer sein
  3. Die Platzersparnis ist minimal
  4. Bitmap-Indizes können nicht verwendet werden
  5. Abfrageleistung. 3NF-Datenbanken leiden unter Leistungsproblemen beim Aggregieren oder Abrufen vieler dimensionaler Werte, die möglicherweise analysiert werden müssen. Wenn Sie nur Betriebsberichte erstellen, können Sie möglicherweise mit 3NF auskommen, da Ihr Betriebsbenutzer nach sehr feinkörnigen Daten sucht.

Es gibt einige Argumente, warum Normalisierung nützlich sein kann. Es kann von Vorteil sein, wenn ein Teil der Hierarchie mehr als einer Dimension gemeinsam ist. Beispielsweise kann eine geografische Dimension wiederverwendbar sein, da sie sowohl von der Kunden- als auch von der Lieferantendimension verwendet wird.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.