Machine Learning Wichtige Ansätze für erfolgreiche ML-Projekte

Von Dipl. Betriebswirt Otto Geißler Lesedauer: 4 min

Anbieter zum Thema

In den meisten Fällen scheitern Projekte für maschinelles Lernen (ML) nicht an einem „falschen“ Algorithmus, sondern an der mangelnden organisatorischen Unterstützung, einem klaren Fahrplan und einer einfachen Methode. Welche entscheidenden Vorüberlegungen müssen für ML-Projekte angestellt werden?

Die Implementierung von Standardschritten erhöht die Transparenz eines ML-Projekts.
Die Implementierung von Standardschritten erhöht die Transparenz eines ML-Projekts.
(Bild: © putilov_denis - stock.adobe.com)

Damit ein ML-Projekt erfolgreich verläuft, muss jeder Projekt-Teilnehmer zum Gelingen beitragen. Das ist insbesondere dann von Bedeutung, wenn es sich um technische Entwicklungen mit vielen komplexen Teilaufgaben handelt, die nicht von einer einzigen Person in angemessener Zeit bewältigt werden kann. In der Folge sind einige der wichtigsten Anforderungen aufgelistet, die von den jeweiligen Mitarbeitern eines Projekts, das maschinelles Lernen beinhaltet, beachtet werden sollten:

Problemstellung und Definition der benötigten Ressourcen

Maschinelles Lernen sollte niemals nur deshalb implementiert werden, weil es gerade als innovativ erscheint. Der erste Schritt muss immer darin bestehen, folgende Punkte zu definieren: das Problem, die dafür benötigten Ressourcen und die möglichen Einschränkungen. Dazu sind unter anderem folgende Fragen zu klären:

  • Was für ein Problem soll gelöst werden?
  • Ist es relevant?
  • Was ist der Nutzen?
  • Wurde dieses Problem bereits von anderen Unternehmen gelöst?
  • Wie lange könnte eine mögliche Entwicklung dauern?
  • Existieren genügend Daten, um das Problem zu lösen?
  • Wie können sie extrahiert werden?
  • Gibt es die dafür erforderliche Infrastruktur, um eine Entwicklung zu starten?
  • Steht die nötige Manpower dazu bereit?
  • Gibt es irgendwelche rechtlichen Einschränkungen?

Experten mit relevanten Fachqualifikationen integrieren

Es sollten immer eine Reihe von Fachleuten in das Projekt einbezogen werden, die das gesamte Problem, seine Feinheiten und alle relevanten Details aus verschiedenen Perspektiven beleuchten können. Damit lassen sich von vornherein falsche Ansätze vermeiden, während das Team versucht, auf einem nicht zielführenden Konsens aufzubauen. Denn selbst wenn das Problem schon einmal gelöst oder eine von einem Dritten entwickelte Lösung gefunden wurde, muss es sich nicht zwingend um dasselbe Problem handeln.

Projektumfang definieren

ML-Projekte können im schlimmsten Falle so viel Zeit in Anspruch nehmen, wie Kreativität dafür zum Einsatz kommt. Daher sollte ein Projektumfang definiert werden, der darauf abzielt, ein Minimum Viable Product (MVP) in einer kurzen Zeitspanne zu erstellen und dann in zukünftigen Iterationen des Projekts daran weiterzuarbeiten. Kleiner Tipp: Es muss klipp und klar zum Ausdruck kommen, was zu diesem MVP gehört, damit am Ende des Projekts keine Zweifel entstehen können.

Technische und geschäftliche Leistungsmetriken definieren

Wenn eine Leistungsmessung des Modells mit einfachen Worten nicht möglich ist, läuft etwas falsch. Dies manifestiert sich häufig durch Unklarheiten hinsichtlich des Umfangs, der Transparenz und der geschäftlichen Anforderungen. Für die Erörterung von Fragen der Leistungsmessung sollte sich das ML-Team entsprechend Zeit nehmen. Kleiner Tipp: Zu diesem Zweck könnte das Team zunächst eine einfache Version des Modells ausprobieren und die Ergebnisse überprüfen.

Daten und ihren Erzeugungsprozess verstehen

ML-Teams sollten niemals ein Modell erstellen, bevor die verwendeten Daten nicht vollständig verstanden wurden. Hier sind einige Fragen, die dabei helfen sollen, sich auf den Projektstart vorzubereiten:

  • Woher stammen die Daten?
  • Wie oft werden die Daten generiert bzw. aktualisiert?
  • Werden diese Daten auch für andere Zwecke verwendet? Wenn ja, wofür?
  • Wird eine Data-Governance-Struktur befolgt?
  • Können die Daten so verwendet werden, wie sie sind, oder sind sie aus Datenschutzgründen zu verschlüsseln?
  • Sind die Datenquellen stabil oder besteht ein gewisses Maß an Unsicherheit über ihre Nachhaltigkeit in der Zukunft?

Auf Basis dieser Fragen kann das Team beurteilen, ob alle Datenquellen (intern und extern) zusammengefasst, die vorhandenen Variablen dokumentiert oder ein Datenmodell (Entity-Relationship-Diagramm) generiert werden müssen.

Darstellung des Arbeitsablaufs

In der Regel sollten ML-Projekte nachfolgende Standardschritte aufweisen:

  • Problem und Umfang definieren.
  • Identifizieren und extrahieren der relevanten Daten.
  • Analyse von fehlenden Daten und Ausreißern.
  • Arbeit am Feature-Engineering-Prozess.
  • Festlegung des Modellierungsansatzes. Unter welchem theoretischen Rahmen wird gearbeitet?
  • Erstellen eines Benchmark-Modells und dessen Verbesserung.
  • Überprüfung der Performance des Modells.

Dadurch wird die Transparenz der Arbeit erhöht und etwaige Nicht-Datenexperten, die an dem Prozess beteiligt sind, erhalten einen Hinweis auf die Komplexität des Problems. Dies wird dem Team wiederum helfen, die möglichen Verzögerungen, die auftreten können, besser zu erklären.

Entscheidungen mit dem Team besprechen

Gut ausgebildete Kommunikationsfähigkeiten sind hier von großem Wert: Einer der schlimmsten Fehler, den Projektleiter machen können, besteht darin, keine zweite Meinung zu den getroffenen Design-Entscheidungen einzuholen. Das heißt, sowohl von technischen als auch von nicht-technischen Fachleuten. Nicht selten denken gerade Fachleute, dass sie alles verstehen, was sicherlich oft der Fall ist, aber es ist in solchen Projekten fast unmöglich, stets absolut alle Facetten zu berücksichtigen. Daher sollten immer viele Fragen gestellt werden. Es lohnt sich, die potenziellen Nutzer der Lösung mit einzubeziehen. Dadurch schreiten die Wissenstransfer-Sitzungen nahtlos voran, was zudem die Einführung der neuen Tools erleichtert. Indem Transparenz priorisiert wird, erhöht sich ebenfalls das Vertrauen in die Arbeit.

Dokumentation (nicht nur für den Code)

Die oft vernachlässigte Dokumentation ist das wertvollste Ergebnis einer Entwicklung. Warum? Dokumentationen haben den gleichen Zweck wie Geschichtsbücher. Das heißt, uns dabei zu helfen, vergangene Fehler zu vermeiden und Entscheidungen zu verstehen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Softwareentwicklung und DevOps

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Botschafter für das Projekt finden

Insbesondere in großen Organisationen ist es angezeigt, „interne Verfechter“ für ML-Projekte zu finden. Selbst wenn bei der Entwicklung die neuesten Algorithmen verwendet und hervorragende Arbeit geleistet wurde, hilft es nichts, wenn die eigene Firma den Wert der Arbeit nicht anerkennen will. Für diesen Fall ist es immer nützlich, interne Vorreiter zu finden, die das Projekt fördern und deren Nutzung durchsetzen.

(ID:49355042)