Amazon Kinesis Data Analytics Datenstrom-Analyse für Java-Entwickler unter AWS
Die Echtzeit-Datenstrom-Analyse mit Amazon Kinesis ist jetzt auch für Java-Entwickler verfügbar. Hierfür können sie Apache Flink und das AWS SDK for Java als Bibliotheken in der integrierten Entwicklungsumgebung ihrer Wahl einbinden.
Anbieter zum Thema

Die beiden Open-Source-Bibliotheken Apache Flink und AWS SDK für Java machen es möglich, Data Streaming mit nur einer Zeile Code in einer Java-Anwendung verfügbar zu machen. Entwickler können also ihren eigenen Java-Code verwenden, um Echtzeitanwendungen zu erstellen, die Streaming-Daten verarbeiten.
Mit Amazon Kinesis Data Analytics lassen sich die Daten in Echtzeit mit Standard-SQL verarbeiten. Hierfür muss der Entwickler seine IDE um die beiden genannten Open-Source-Bibliotheken erweitern, da diese integrierte Operatoren für gängige Datenverarbeitungsfunktionen enthalten. So ist die Applikation dazu in der Lage, Daten jeder Größenordnung zu organisieren, zu transformieren, zu aggregieren und zu analysieren.
Die Anbindung an Datenquellen erfolgt dann über die Integration von „Amazon Kinesis Data Streams“. Als Streaming-Ziele kommen Amazon S3, Amazon DynamoDB, Amazon Kinesis Data Streams und Amazon Kinesis Date Firehose in Frage. Außerdem enthalten die Java-Bibliotheken zusätzliche Konnektoren für Tools wie Cassandra, ElasticSearch, RabbitMQ, Redis und mehr sowie die Möglichkeit, kundenspezifische Integrationen zu erstellen.
Als Anwendungsfälle nennt Amazon die kontinuierliche Transformation und das Laden von Daten in Data Lakes, die Generierung von Metriken zur Einspeisung von Echtzeit-Gaming-Ranglisten, die Anwendung von Machine Learning-Modellen auf Datenströme von angeschlossenen Geräten und mehr.
Danilo Poccia, Principal Evangelist im Serverless-Bereich bei AWS, zeigt im AWS-Developers-Blog, wie das Einbinden von Data Streams unter Java funktioniert. Amazon Kinesis Data Analytics for Java ist ab sofort in den Regionen EU West (Irland), USA Ost (North Virginia), USA Ost (Ohio), USA West (Oregon), verfügbar.
Die Preisgestaltung orientiert sich an Amazon Kinesis Data Analytics for SQL, allerdings wird pro Java-Anwendung eine zusätzliche Amazon Kinesis Processing Unit (KPU) für die Orchestrierung verwendet. Zudem schlagen der Betrieb von Anwendungsspeichern und dauerhafte Anwendungs-Backups zu Buche. Für die Region North Virginia rechnet Poccia vor, dass eine KPU-Stunde 0,11 US-Dollar kostet, der Anwendungsspeicher mit 0,10 Dollar pro Gigabyte-Monat und die Backups mit 0,023 pro Gigabyte-Monat.
(ID:45626747)