Amazon Kinesis Data Analytics

Datenstrom-Analyse für Java-Entwickler unter AWS

| Redakteur: Stephan Augsten

Mit „Amazon Kinesis Data Analytics for Java“ können auch Entwickler Data-Stream-Processing beispielsweise mit Apache Flink in ihre Java-Anwendungen integrieren.
Bildergalerie: 1 Bild
Mit „Amazon Kinesis Data Analytics for Java“ können auch Entwickler Data-Stream-Processing beispielsweise mit Apache Flink in ihre Java-Anwendungen integrieren. (Bild: AWS Germany GmbH)

Die Echtzeit-Datenstrom-Analyse mit Amazon Kinesis ist jetzt auch für Java-Entwickler verfügbar. Hierfür können sie Apache Flink und das AWS SDK for Java als Bibliotheken in der integrierten Entwicklungsumgebung ihrer Wahl einbinden.

Die beiden Open-Source-Bibliotheken Apache Flink und AWS SDK für Java machen es möglich, Data Streaming mit nur einer Zeile Code in einer Java-Anwendung verfügbar zu machen. Entwickler können also ihren eigenen Java-Code verwenden, um Echtzeitanwendungen zu erstellen, die Streaming-Daten verarbeiten.

Mit Amazon Kinesis Data Analytics lassen sich die Daten in Echtzeit mit Standard-SQL verarbeiten. Hierfür muss der Entwickler seine IDE um die beiden genannten Open-Source-Bibliotheken erweitern, da diese integrierte Operatoren für gängige Datenverarbeitungsfunktionen enthalten. So ist die Applikation dazu in der Lage, Daten jeder Größenordnung zu organisieren, zu transformieren, zu aggregieren und zu analysieren.

Die Anbindung an Datenquellen erfolgt dann über die Integration von „Amazon Kinesis Data Streams“. Als Streaming-Ziele kommen Amazon S3, Amazon DynamoDB, Amazon Kinesis Data Streams und Amazon Kinesis Date Firehose in Frage. Außerdem enthalten die Java-Bibliotheken zusätzliche Konnektoren für Tools wie Cassandra, ElasticSearch, RabbitMQ, Redis und mehr sowie die Möglichkeit, kundenspezifische Integrationen zu erstellen.

Als Anwendungsfälle nennt Amazon die kontinuierliche Transformation und das Laden von Daten in Data Lakes, die Generierung von Metriken zur Einspeisung von Echtzeit-Gaming-Ranglisten, die Anwendung von Machine Learning-Modellen auf Datenströme von angeschlossenen Geräten und mehr.

Danilo Poccia, Principal Evangelist im Serverless-Bereich bei AWS, zeigt im AWS-Developers-Blog, wie das Einbinden von Data Streams unter Java funktioniert. Amazon Kinesis Data Analytics for Java ist ab sofort in den Regionen EU West (Irland), USA Ost (North Virginia), USA Ost (Ohio), USA West (Oregon), verfügbar.

Die Preisgestaltung orientiert sich an Amazon Kinesis Data Analytics for SQL, allerdings wird pro Java-Anwendung eine zusätzliche Amazon Kinesis Processing Unit (KPU) für die Orchestrierung verwendet. Zudem schlagen der Betrieb von Anwendungsspeichern und dauerhafte Anwendungs-Backups zu Buche. Für die Region North Virginia rechnet Poccia vor, dass eine KPU-Stunde 0,11 US-Dollar kostet, der Anwendungsspeicher mit 0,10 Dollar pro Gigabyte-Monat und die Backups mit 0,023 pro Gigabyte-Monat.

Kommentare werden geladen....

Kommentar zu diesem Artikel

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45626747 / Cloud-Umgebungen & PaaS)