Intelligentes, agiles Machine Learning Operations in jeder Cloud Was die MLOps-Plattform Charmed Kubeflow 1.4 bietet

Ein Kommentar von Rob Gibbon *

MLOps ist eng an DevOps angelehnt: Klar definierte Prozesse, moderne Tools und automatisierte Arbeitsabläufe sollen das Development und Deployment von Machine-Learning-Modellen rationalisieren. Das ist allerdings alles andere als trivial.

Anbieter zum Thema

Rob Gibbon
Rob Gibbon
(Bild: Canonical)

Machine-Learning-Operations (MLOps) basiert auf bewährten DevOps-Prinzipien und -Methoden, die die Effizienz von Workflows erhöhen. Das sind zum Beispiel Entwicklungsmethoden wie Continuous Integration, Continuous Delivery und Continuous Deployment. So erhöht der Ansatz die Produktivität, verbessert die Governance und reduziert die mit Schatten-IT verbundenen Risiken.

Als MLOps-Plattform soll Charmed Kubeflow den Dateningenieuren und -wissenschaftlern ihre Arbeit erleichtern. Das Leistungsspektrum umfasst AM/ML-Modell-Ideation, -Training, -Freigabe und -Wartung vom Konzept bis zur Produktion. Mit Kubeflow Pipelines ist auch eine Engine zur Orchestrierung von MLOps-Workflows wie Feature Engineering, Deep-Learning-Modelltraining, Experimentieren und Freigabe von Modellartefakten für die Produktion vorhanden.

Charmed Kubeflow ist kostenlos: Die Lösung läuft in jeder Umgebung ohne Einschränkungen, Paywall oder Funktionsbeschränkungen. Data Labs und MLOps-Teams müssen ihre Data Scientists und Entwickler nur einmal schulen, um konsistent und effizient in jeder Cloud oder On-Premises zu arbeiten. Die zentralisierte und browserbasierte MLOps-Plattform läuft auf jedem Kubernetes-konformen System.

Die neueste Version bietet mehrere Funktionen für ein erweitertes Modell-Lebenszyklus-Management, einschließlich Upstream-Kubeflow 1.4 und Unterstützung für MLFlow-Integration. Charmed Kubeflow 1.4 ist unmittelbar einsatzfähig. Data Scientists verwenden dafür Juju, das einheitliche Operator-Framework für die hyperautomatisierte Verwaltung von Anwendungen, die sowohl auf virtuellen Maschinen als auch auf Kubernetes laufen.

Die neue Version steht ab sofort im „Stable Channel“ von CharmHub zur Verfügung. Der Juju-Befehl …

juju deploy kubeflow

… genügt, um die Lösung auf jedem konformen Kubernetes-Cluster bereitzustellen. Die vollständige Installationsanleitung ist im Getting-Started-Guide verfügbar.

Die Bereitstellung und Konfiguration der Charmed Kubeflow 1.4 MLOps-Plattform als primäre KI/ML-Infrastruktur des Datenlabors ist einfach. Ingenieure und Datenwissenschaftler verfügen mit MicroK8s über ein System, mit dem sie schnell und unkompliziert eine Evaluierungsumgebung einrichten können – mit oder ohne GPU-Beschleunigung. Die leistungsstarke, hochentwickelte End-to-End-MLOps-Plattform kann in einer halben Stunde oder weniger mit MicroK8s oder einer anderen konformen Kubernetes-Distribution bereitgestellt werden. Eine Einführung bietet ebenfalls der Getting Started Guide.

Besseres Modell-Lebenszyklus-Management dank MLFlow-Integration

Kubeflow 1.4 hat die Benutzerfreundlichkeit gegenüber früheren Versionen verbessert. Besonders hervorzuheben ist der einheitliche Trainingsoperator, der die beliebten AI/ML-Frameworks TensorFlow, MXNet, XGBoost und PyTorch unterstützt. Dies erleichtert die Handhabung, aber auch zukünftige Erweiterungen und verringert den Ressourcenverbrauch auf dem Kubernetes-Cluster.

Charmed Kubeflow unterstützt jetzt die MLFlow-Integration für ein echtes automatisiertes Modell-Lebenszyklus-Management mit MLFlow-Metriken und MLFlow-Modellregistrierung. MLFlow ist eine Open-Source-Plattform für KI/ML-Modell-Lebenszyklusmanagement und umfasst Funktionen für das Experimentieren, die Reproduzierbarkeit und Bereitstellung. MLFlow bietet auch eine zentralisierte Modellregistrierung.

Datenwissenschaftler und Dateningenieure können die MLFlow-Integrationsfunktionen so einstellen, dass Modellabweichungen automatisch erkannt werden und eine Kubeflow-Retraining-Pipeline von Modellen auslösen. Modellabweichungen können auftreten, wenn die Genauigkeit des Modells im Laufe der Zeit abnimmt. Dies passiert bei Änderungen im Live-Vorhersagedatensatz im Vergleich zum Trainingsdatensatz.

Auch MLFlow auf einem Kubernetes-Cluster zu aktivieren und in eine Charmed-Kubeflow-Bereitstellung mithilfe des Juju-Unified-Operator-Frameworks zu integrieren, gestaltet sich unkompliziert. Dafür steht der MLFlow-Juju-Operator in CharmHub zur sofortigen Bereitstellung zur Verfügung.

Bessere Governance dank optimierter Multi-User-Unterstützung

Charmed Kubeflow 1.4 unterstützt Multi-User-Deployment-Szenarien für alle Kubeflow-Komponenten von Anfang an, einschließlich Kubeflow-Notebooks, -Pipelines und -Experimente.

Rob Gibbon
Rob Gibbon
(Bild: Canonical)

Der Leitfaden zur Integration von Authentifizierungsanbietern enthält weitere Informationen zur Einrichtung von Mehrbenutzer-Zugriffskontrollen für die Charmed Kubeflow 1.4 MLOps-Plattform. Eine Anleitung wie Data Scientists Azure Spot-Instanzen nutzen können, um die Kosten für die Ausführung von MLOps-Workflows in der Microsoft Azure-Cloud zu optimieren, findet sich auf Ubuntu.com.

* Rob Gibbon ist Produktmanager bei Canonical. Mit mehr als 20 Jahren Branchenerfahrung in Aufbau, Ausbau und Management sowie der Betreuung der Teams, Technologien und Umgebungen, die hinter großen Webangeboten und Data Hubs in allen Branchen stehen, verfügt Gibbon über fundierte geschäftliche und technische Kenntnisse in der Produktführung.

(ID:48037112)