Definition „Distributed Database“ Was ist eine verteilte Datenbank?

Von chrissikraus

Anbieter zum Thema

Eine verteilte Datenbank wird nicht zentral gespeichert, sondern auf verschiedene Ablageorte verteilt. Die Verwaltung übernimmt ein verteiltes Datenbankmanagementsystem.

Von einer möglichen räumlichen Trennung bekommt man bei der Arbeit mit einer verteilten Datenbank in der Regel nichts mit.
Von einer möglichen räumlichen Trennung bekommt man bei der Arbeit mit einer verteilten Datenbank in der Regel nichts mit.
(© sdecoret - stock.adobe.com)

Regulär stellt man sich eine Datenbank so vor, dass alle gespeicherten Informationen auf einem zentralen Server liegen. Dort kann man auf die Daten zugreifen und mit ihnen arbeiten. Bei einer verteilten Datenbank (englisch Distributed Database) werden Teile der Informationen an unterschiedlichen physischen Orten gespeichert. Je nach Bedarf kann es sich um Replikation der Gesamtheit der Daten oder um einzelne Fragmente handeln.

Als physische Standorte kommen sowohl verschiedene Rechner an einem Unternehmensstandort als auch geografisch deutlich voneinander entfernte Orte in Frage. Die Struktur kann dabei von einem sehr lokalen Kontext mit wenigen Stationen bis hin zu einer globalen verteilten Datenbank mit Hunderten oder Tausenden Speicherorten reichen.

Die Verarbeitung der Daten geschieht häufig lokal an dem Ort, an dem die entsprechenden Informationen gespeichert sind. Dabei wird unabhängig von den anderen verteilten Segmenten auf dem jeweiligen lokalen System gearbeitet. Die übergreifende Verwaltung hingegen wird zentral organisiert.

Verwaltung verteilter Datenbanken

Um die Gesamtheit der verteilt organisierten Daten effizient verwalten zu können, ist ein zentrales System hilfreich. Man spricht hier von einem verteilten Datenbankmanagementsystem oder Distributed Database Management System (kurz DDBMS). Solch ein System ermöglicht Benutzern z. B., dass sie trotz verteilter Speicherung bei Bedarf auf alle Daten zugreifen können.

Hierfür muss das DDBMS die logische Verbindung abbilden, die die fragmentierten Daten untereinander haben. Seitens des Benutzers fühlt sich die Arbeit mit der so aufbereiteten Datenbank vergleichbar zur Arbeit mit einer zentral gespeicherten Datenbank an. Der Zugriff auf die Gesamtheit der Daten über das DDBMS ist komfortabel möglich und erfordert kein gesondertes Wissen über die physikalische Organisation der verteilten Datenbank.

Eine weitere wichtige Aufgabe des DDBMS ist es, die verteilten Daten in regelmäßigen Abständen zu synchronisieren. Werden Daten an einem Ablageort verändert, gelöscht oder neu angelegt, müssen diese Aktualisierungen auch an allen Speicherorten übernommen werden, an denen die betreffenden Informationen hinterlegt sind. Nur so kann man sicherstellen, dass jede Stelle mit aktuellen und korrekten Daten arbeitet. Ein DDBMS kann diese Synchronisierung automatisch erledigen und die Arbeit mit den Daten somit komfortabler und zuverlässiger gestalten.

Arten verteilter Datenspeicherung

Wie bereits erwähnt, können verteilte Datenbanken wahlweise durch Replikation der gesamten Daten oder durch Fragmentierung in Teilstücke genutzt werden.

Replikation

Die Datenbank wird in ihrer Gesamtheit an verschiedenen Speicherorten aufbewahrt. Das schafft Redundanz und vermeidet so Datenverluste, wenn ein Standort einmal ausfallen sollte. Ferner kann die Datenmenge so gezielt geografisch verteilt werden, um lokal für hohe Verfügbarkeit zu sorgen.

Wenn unabhängig vom Standort generell die gesamte Datenbank schnell erreichbar sein soll, ist diese Art der verteilten Datenbank nützlich. Ein Nachteil ist, dass laufend die gesamte Datenbank an jedem Standort aktuell gehalten werden muss, damit Nutzer keine veralteten Informationen erhalten.

Fragmentierung

Die Datenbank wird in Teilstücke zerlegt und auf verschiedene physikalische Standorte verteilt. Das ist z. B. dann vorteilhaft, wenn an den einzelnen Lokalitäten jeweils nur bestimmte Daten regelmäßig gebraucht werden. So müssen lokal nur wesentlich kleinere Teile der Datenbank gespeichert werden und man kann unabhängiger vom Gesamtsystem arbeiten.

Außerdem hat die Station vor Ort jeweils die Daten schnell verfügbar, die für die tägliche Arbeit gebraucht werden. Das DDBMS sorgt für die Synchronisation der relevanten Daten und kann bei Bedarf für die Integration aller Daten sorgen.

Die beiden Ansätze können voneinander getrennt oder als Hybridlösung genutzt werden.

Verschiedene Typen verteilter Datenbanken

Verteilte Datenbanken können strukturell betrachtet homogen oder heterogen organisiert sein.

Homogene verteilte Datenbanken

Bei einer homogenen Struktur ist jeder Standort identisch ausgerüstet. Das bedeutet, dass alle Lokalitäten die gleiche Hardware, das gleiche Betriebssystem und die gleichen Datenbankanwendungen verwenden. Es sprechen also alle Stationen "die gleiche Sprache". Datenaustausch und die Integration über das DDBMS sind unkompliziert zu realisieren.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Softwareentwicklung und DevOps

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Heterogene verteilte Datenbanken

Bei einer heterogenen Struktur können Hardware, Software und Betriebssystem jeder Lokalität individuell sein, z. B. nach dem jeweiligen Bedarf vor Ort. Auch die Datenmodelle könnten von Ort zu Ort unterschiedlich sein. Hier kann es also vorkommen, dass inkompatible Technologien aufeinandertreffen. In diesen Fällen muss zwischen den einzelnen Stationen übersetzt werden, wenn eine Kommunikation stattfinden soll, z. B. über individuell angefertigte Schnittstellen.

Das DDBMS muss verschiedene Technologien so integrieren können, dass die Verwaltung und der Einblick ins Gesamtsystem reibungslos möglich ist. In der Praxis kann dieser Ansatz so komplex werden, dass der Wartungsaufwand und damit die Wirtschaftlichkeit eines solchen Systems infrage steht.

(ID:47821785)