Definition „Data Modeling“ Was ist Datenmodellierung?

Autor / Redakteur: Gedeon Rauch / Stephan Augsten

Bei der Datenmodellierung werden Darstellungen von Daten für eine Datenbank erarbeitet. Dies ist maßgeblich entscheidend dafür, wie die Daten dargestellt werden und welche Richtlinien für die Daten gelten – dies gibt ein Regelwerk für die Datenbank.

Firmen zum Thema

Beim Data Modelling wird vom Entwurf aus über die verschiedene Schemata die finale Datenbank definiert und aufgebaut.
Beim Data Modelling wird vom Entwurf aus über die verschiedene Schemata die finale Datenbank definiert und aufgebaut.
(Bild: campaign-creators / Pixabay )

Datenmodellierung bei Datenbanken ist ein Prozess, der grundsätzliche Konventionen, Regeln und Richtlinien festlegt und dadurch sicherstellt, dass eine Datenbank in sich konsistent ist und alle Daten in der Praxis so funktionieren wie dies angestrebt wurde.

Dabei ist der Prozess der Datenmodellierung an sich ziemlich einfach zu beschreiben, denn er läuft – vereinfacht ausgedrückt – in drei Schritten ab:

  • 1. Daten erhalten eine Zuordnung zu Entitäten (bei diesen handelt es sich um Geschäftsobjekte).
  • 2. Durch eine klare Definition erhalten Entitäten Attribute, diese geben spezifische Eigenschaften und Merkmale an.
  • 3. Die Entitäten werden in eine Relation zueinander gesetzt.

An einem stark vereinfachten Beispiel sei dies erklärt: Jede Kundin und jeder Kunde einer Bank ist eine Entität, die verschiedene Attribute enthält. Dies sind der Name, aber auch die IBAN und die bei der Bank gebuchten Produkte.

Mit jeder Transaktion werden neue Beziehungen zu den Entitäten gesetzt, wenn ein Betrag X von einer Entität zur nächsten überwiesen wird. In der Datenbank lässt sich dieses Verhältnis dank einer an die Aufgabe angepassten Datenmodellierung darstellen, ablesen und nachverfolgen.

Wie funktionieren Datenmodellierungen in der Praxis?

Bei einer Datenmodellierung handelt es sich um den Prozess der Erstellung des Datenmodells für eine Datenbank. Dabei werden visuelle Darstellungen für Datenobjekte, Zuordnungen und Regeln erstellt. Dies ist hilfreich, um die Daten einer Datenbank überhaupt visuell lesbar und verständlich zu machen, aber auch um gewisse Regeln zu erzwingen.

Beim Forcieren dieser Regeln geht es etwa um Richtlinien der Benennung für die Indexierung. In einer Namensdatenbank etwa dürfen keine Ziffern in den Feldern enthalten sein, eine E-Mail-Adresse muss den Konventionen einer E-Mail-Adresse (mit @ und .) folgen.

Ziel ist die Gewährleistung der Sicherheit, Konsistenz und Semantik der Datenbank, der Datenqualität und der Einhaltung von Regeln. Ein automatisierter E-Mail-Versand kann etwa nur dann erfolgen, wenn alle E-Mail-Adressen einer Datenbank auch tatsächlich solche sind.

Data Warehouse, Data Lake und Business Intelligence

Bei der Datenmodellierung handelt es sich um einer Art Bau- oder Fahrplan für die Erstellung des Datenmodells einer Datenbank. Hierbei wird in abstrahierter Form angegeben, wie die angestrebte Datenlösung informationstechnisch erreicht werden soll. Erarbeitet wird also, welche Daten für die Ziele der Datenbank notwendig sind, wie diese aufbereitet und dargestellt werden müssen und wie neue Daten laufend in die Datenbank integriert werden können.

Eine neuralgische Stelle bei der Erstellung von Datenbanken ist die Datenmodellierung vor allem deswegen, weil sie wohl durchdacht und konzipiert sein will. Je besser die Datenmodellierung auch in der Konzeptionsphase einer Datenbank designt ist, desto besser kann der geregelte Datenbankbetrieb erfolgen. Nachträgliche Eingriffe sind kosten- und zeitaufwendig, können aber durch eine durchdachte Modellierung umgangen werden.

Da das Arbeiten mit Datenbänken stets neue Herausforderungen wie Echtzeit- oder KI-Analysen meistern muss, ist das Erstellen einer adäquaten Datenmodellierung eine Herausforderungen für die Solution Architects von digitalen Datenbanken. Erforderlich ist eine Datenmodellierung bei klassischen Unternehmensdatenbanken, Data Warehouses (DWH) und Data-Lake-Modellen (bei denen aus den Rohdaten nur auf Abfrage aufbereitete Daten entstehen).

Herausforderungen der Datenmodellierung

Die Probleme, vor denen die angewandte Datenmodellierung heute steht, lassen sich als Zwiespalt zusammenfassen: Je präziser Datenmodelle modelliert sind, je eingeschränkter die Dateneingabe und die Anlage von Regeln ist, desto robuster ist die Einhaltung aller Regeln für die Datenbank. Selbst bei nahezu freier Skalierung kann eine enge Reglementierung noch hohe Funktionalität garantieren.

Auf der anderen Seite müssen Datenbanken während des Betriebes oft angepasst werden. Diese Form der Adaptierbarkeit erfordert aber eine eher allgemein gehaltene Datenmodellierung, die strukturellen Änderungen gewachsen ist. Dass diese beiden Anforderungen nicht miteinander vereinbar sind und kompromissbereite Modellierungsmethoden erfordern, liegt dabei auf der Hand und stellt eines der konzeptionell interessantesten Spannungsfelder moderner Datenmodellierungsmethoden dar.

Von der Datenmodellierung zum Datenmodell

Wie auch bei Datenmodellen lässt sich die Modellierung in unterschiedliche Varianten einteilen. Die physische, konzeptuelle und logische Modellierung sowie die Datenmodellierung von Unternehmensdaten sind dabei die häufigsten Methoden, die entsprechende Datenmodelle erzeugen.

(ID:47736551)