Registrierungspflichtiger Artikel

Tools und Workflows zur Datenspeicherung in der Cloud, Teil 2 Data-Lake-Strategie mit AWS Data Ingest umsetzen

Autor / Redakteur: Thomas Drilling / Stephan Augsten

Die grundlegenden Technologien und Produkte, die AWS zur Datenspeicherung anbietet, haben wir bereits kennengelernt. Nun wollen wir in demonstrieren, wie Unternehmen mit den Mitteln von AWS eine Data-Lake-Strategie entwickeln können.

Ein Data Lake ist ein zentraler Speicher für große Mengen an strukturierten UND unstrukturierten Daten.
Ein Data Lake ist ein zentraler Speicher für große Mengen an strukturierten UND unstrukturierten Daten.
(Bild: AWS Germany GmbH)

Um möglichen Missverständnissen gleich von Beginn an vorzubeugen: AWS bietet keinen Data-Lake-Service oder ähnliches an. Allerdings lassen sich mit den verschiedenen Datenspeicher- und Datenbank-Diensten in AWS Data-Lake-Strategien auf vielfältige Weise implementieren.

Die von uns vorgeschlagene Strategie ist einen von vielen Möglichen und bietet zahlreiche Ansatzpunkte zur Erweiterung. Das Data-Lake-Konzept ist auch keine Erfindung von AWS und kann auch im eigenen Rechenzentrum eine nützliche Idee sein. Allerdings erschließt sich der Nutzen von Data Lakes primär in der Public Cloud, da es letztendlich um das Speichern und Verarbeiten sehr großer Datenmengen etwa zur Analyse geht.