Suchen

Interview Dev-Insider mit Benjamin Lorenz, MongoDB „Entwickler wollen sich nicht mit Datenbank-Verwaltung beschäftigen.“

Redakteur: Stephan Augsten

Trotz vielversprechender Cloud-Strategien sind Datensilos und eine komplexe Datenverteilung weiterhin Realität. Mit dem Fokus auf die Entwickler will MongoDB Ordnung in die Datenhaltung bringen. Im Gespräch mit Dev-Insider beleuchtet Benjamin Lorenz die aktuelle Strategie des Datenbank-Spezialisten.

Firmen zum Thema

DBaaS kann Entwicklern bei ihrer täglichen Arbeit helfen, produktiver zu sein, ist sich Benjamin Lorenz von MongoDB sicher.
DBaaS kann Entwicklern bei ihrer täglichen Arbeit helfen, produktiver zu sein, ist sich Benjamin Lorenz von MongoDB sicher.
(© peshkov - stock.adobe.com)

Dev-Insider: Herr Lorenz, MongoDB schickt sich aktuell an, die Datenhaltung und -verwaltung in Anbetracht der Cloud-Migration zu überdenken. Was ist denn hier Ihrer Meinung nach in den vergangenen Jahren schiefgelaufen?

Benjamin Lorenz: Wir sehen bei vielen Unternehmen eine heterogene Landschaft von Applikationen, Systemarchitekturen und nicht zuletzt Datenspeichern, die über Jahre gewachsen sind - manchmal auch durch Aufkauf anderer Unternehmen oder Zusammenlegung von Abteilungen.

Das führt zu einer oft recht unübersichtlichen Situation: Welcher Datenkonsument fragt wann, in welchem Volumen und mit welcher Frequenz Informationen ab oder schreibt neue? Wie viele Datenbanken sind beteiligt? Sind die Daten vollständig? Wie soll/kann mit Heterogenität in den Daten umgegangen werden? Und nicht zuletzt: In welchem Umfang muss durch Überprovisionierung der Systeme sichergestellt werden, dass es zu keinen Engpässen bei Lastspitzen kommt?

Hierdurch wird Geld zusätzlich ausgegeben, z.B. für Datenbanken, die nur wenige Wochen im Jahr unter Volllast laufen, sich sonst aber effektiv „langweilen“.

In diesem betrieblichen Umfeld überdenken viele unserer Kunden momentan ihre Public-Cloud-Strategie, um Kosten zu sparen, Risiken von Systemausfällen zu reduzieren, und in geschäftskritischen Initiativen Time-to-Market zu optimieren.

Dev-Insider: Wenn man an den Zugriffsschutz denkt, ist der Begriff „Silo“ oder im Speziellen auch „Datensilo“ ja aber nicht einmal etwas Schlechtes. Kann es nicht hier oder dort sinnvoll sein, an einer gewissen Fragmentierung oder – wenn wir es aus einem größeren Blickwinkel betrachten – der Rechenzentrumsstruktur festzuhalten?

Benjamin Lorenz: Aus dem Gesichtspunkt der Datensicherheit oder auch Compliance (Data Locality, GDPR), ist es definitiv richtig und auch wichtig, Daten zu segmentieren und geeignet abzuspeichern. Gleichzeitig steigen stetig die Anforderungen hinsichtlich der Fähigkeiten zur Auswertung der gesamten Daten (für Personalisierung, KPIs/Dashboards, Machine Learning, etc.).

Wir kommen diesen Ansprüchen mit dem DBaaS (Datenbank as a Service) Atlas und der „Global Clusters“-Funktion entgegen. Damit bietet MongoDB eine verlässliche Option zur weltweiten, Latenz-optimierten Aufteilung von Daten, unter Berücksichtigung lokaler Anforderungen an Datensicherheit und Zugriffskontrolle. Dies erlaubt die Provisionierung eines abgesicherten und weltweit skalierenden Clusters mit ein paar Mausklicks oder einer Handvoll API-Aufrufen.

Dev-Insider: Nun sind ja Datenbanken ein recht spezieller Bereich, der früher in der Regel einer bestimmten Entwickler-Gruppe vorbehalten war. Stellen Unternehmen mittlerweile vielleicht zu hohe Anforderungen an ihre Dev-Teams?

Benjamin Lorenz: Wir sehen momentan ganz klar den Trend zum Einkauf von Technologie as a Service, inklusive der Datenbank-Schicht. DBaaS kann Entwicklern bei ihrer täglichen Arbeit helfen, produktiver zu sein. Entwickler möchten sich nicht mehr mit der zeitaufwändigen Verwaltung von Datenbanken beschäftigen.

Ist erstmal für die Datenbankverwaltung gesorgt, so können sie sich auf ihre eigentlichen Aufgaben konzentrieren und an der nächsten großen Anwendung arbeiten. Viele Unternehmen organisieren sich darüber hinaus heute in Microservice-Teams, die dann, dem DevOps-Gedanken folgend, für eine Funktionalität der Applikation in Eigenverantwortung die vollständige Vertikale betreuen: vom Frontend über den Service-Layer bis hin zur Persistenzschicht.

Dev-Insider: War der Switch von traditionellen, strukturierten Datenbanken zur unstrukturierten Big-Data-Datenhaltung vielleicht einfach zu schnell?

Benjamin Lorenz: Kunden sehnen sich nach mehr Flexibilität im Umgang mit Daten. Dies impliziert nicht notwendigerweise, dass die Daten zunehmend unstrukturiert sind, vielmehr, dass mit dem natürlichen Polymorphismus besser umgegangen werden soll.

Nehmen wir uns beispielsweise einen E-Commerce-Shop: Eine Jeans und eine Digitalkamera haben sicherlich gemeinsame Eigenschaften, etwa eine Marke und einen Preis, aber auch sehr viele unterschiedliche: Die Jeans hat Länge und Breite, die Digitalkamera eine Anzahl Pixel oder auch eine bestimmte Batterieleistung. Dies in einer tabellarischen Datenbank zu speichern, ist traditionell herausfordernd und umständlicher, als die Daten ganz natürlich und so polymorph wie sie sind in einer JSON-Struktur zu speichern.

Dev-Insider: Wo kann die Cloud-basierte Datenhaltung ihren Vorteil gegenüber On-Premises ausspielen und wann ist eher ein Hybridkonzept sinnvoll?

Benjamin Lorenz: Viele Kunden sehen eine Überprovisionierung in ihren Rechenzentren: Die Systeme sind für Peak-Zeiten ausgelegt, haben ansonsten aber tendenziell wenig zu tun. Dies führt zu überproportional hohen Kosten, die durch einen Wechsel in die Cloud mit ihren flexiblen Skalierungsmöglichkeiten signifikant reduziert werden können. Auto-Scale-Funktionen können mittlerweile nicht mehr nur den Plattenplatz bei Bedarf regulieren, sondern auch die CPU/RAM-Kapazität hoch- und auch wieder herunterfahren.

Dev-Insider: Wie kommt MongoDB den modernen Szenarien aktuell entgegen? Wo geht die Reise mit Ihren Produkten hin?

Benjamin Lorenz: MongoDB entwickelt sich immer weiter zu einer modernen Datenplattform, die von unseren Kunden genutzt wird, um gleichzeitig OLTP- und OLAP-Anforderungen abzudecken. Hierzu wurde kürzlich Atlas Search offiziell freigegeben, das auf Lucene basiert und Volltext-Analysen und -Suche unterstützt. Ebenso erlauben jetzt Atlas Data Lake und Atlas Online Archive eine elegante Verknüpfung von Hot Storage im Primary Tier (auf Basis von Cloud VM Instanzen) mit Warm/Cold Storage im Secondary Tier (auf Basis von z.B. Amazon S3), inklusive einem automatischen Transfer der gealterten Daten.

Die Speicherung von vielen Terabyte, bis hin zu Petabyte, wird so auch in der Public Cloud wirtschaftlich praktikabel, ebenso können Daten in ganz unterschiedlicher Repräsentation – JSON, CSV, Parquet, u.a.m., über eine Abfragesprache verarbeitet (CRUD), und ebenso auch Near-Realtime-Analysen implementiert werden (MongoDB Aggregation Framework).

Dev-Insider: Und was haben Entwickler genau davon?

Benjamin Lorenz
Benjamin Lorenz
(Bild: MongoDB)

Benjamin Lorenz: Anforderungen, die an den modernen Entwickler herangetragen werden, lassen sich mit einer zeitgemäßen Datenplattform wie der unseren mit wesentlich weniger Aufwand bei gleichzeitig größerer Flexibilität umsetzen. Es reicht eine Abfragesprache zu den Daten, für OLAP und OLTP, für Datenarchiv einerseits und produktive Daten andererseits. Die Repräsentation in einem hierarchisch strukturierten Format wie JSON hilft, die Datenwelt genauso vielfältig abzubilden wie sie ist, ohne Kunstgriffe wie ORM oder Denormalisierung.

* Benjamin Lorenz ist Pre-Sales Manager Central Europe und Solutions Architecture bei MongoDB. Er ist verantwortlich für die technische Beratung von MongoDB in der DACH-Region und unterstützt sein Team und eine Reihe innovativer Kunden bei geschäftskritischen Projekten.

(ID:46812480)