Open-Source-gestützte Entwicklung mit R und Python Die Python-Distribution Anaconda nutzen

Autor / Redakteur: Thomas Joos / Stephan Augsten

Anaconda ist eine Open-Source-Distribution von Python und R inklusive Paketverwaltung. Vor allem im Machine Learning findet die für Windows, Linux und macOS erhältliche Python-Distribution gerne Anwendung.

Firma zum Thema

Die Anaconda-Kommandozeile lässt sich unter Windows via Terminal und PowerShell aufrufen.
Die Anaconda-Kommandozeile lässt sich unter Windows via Terminal und PowerShell aufrufen.
(Bild: Joos / Anaconda)

Die Open-Source-Distribution Anaconda wird häufig in den Bereichen Machine Learning, Data Science und bei der Analyse von umfangreichen Datenmengen verwendet. Es gibt weit über 1.500 Pakete, die mit Anaconda installiert werden können.

Durch die Integration von Python und R ist die Distribution gut ausgestattet, um eine Entwicklungsumgebung zur Big-Data-Analyse und für künstliche Intelligenz flexibel zur Verfügung zu stellen. Für die Installation von Paketen und Erweiterungen ist es dabei fast unabdingbar, ein kostenloses Konto bei Anaconda.org zu erstellen.

Das Konto dient dabei nicht nur dazu, Packages zentral zu verwalten. Vielmehr lässt es sich unter anderem dazu nutzen, neben den Packages auch Jupyter Notebooks und Environments in der Anaconda-Cloud zu speichern und mit anderen Anwendern zu teilen.

Anaconda kostenlos mit Windows, Linux und macOS nutzen

Anaconda-Umgebung mit R und Python installieren.
Anaconda-Umgebung mit R und Python installieren.
(Bild: Joos / Anaconda)

Installieren lässt sich die komplette Python-Umgebung in Windows, Linux und macOS. Anaconda bietet so eine flexible Möglichkeit, mit Python und R zu arbeiten. Dies ist von Vorteil, wenn man selbst mit mehreren Betriebssystemen arbeitet oder im Team unterschiedliche Systeme zum Einsatz kommen.

Über die Zugriffsmöglichkeiten auf ein kostenloses Cloud-Konto können auch Daten zwischen den Computern ausgetauscht werden. Anaconda steht als kostenlose Version und als kostenpflichtige Enterprise-Version zur Verfügung. Für den Einstieg reicht in den meisten Fällen die kostenlose Version aus.

Für die Installation auf Windows 10 kann der Installer einfach auf der Webseite heruntergeladen werden. Das gilt auch für macOS und Linux. Die Installationsanleitung für Linux ist in der Dokumentation von Anaconda zu finden. Die Installation für Windows besteht in der Bestätigung weniger Mausklicks.

Anaconda einrichten – Navigator und Conda

Anaconda mit dem Navigator verwalten und zusätzliche Packages installieren.
Anaconda mit dem Navigator verwalten und zusätzliche Packages installieren.
(Bild: Joos / Anaconda)

Nach der Installation von Anaconda stehen verschiedene Werkzeuge zur Verwendung, um mit dem System zu arbeiten. Mit dem Anaconda Navigator steht eine grafische Oberfläche für die Verwaltung von Anaconda auf dem Computer zur Verfügung. In Windows ist Anaconda Navigator im Startmenü zu finden, in macOS kann nach dem Tool mit Spotlight gesucht werden. Der Anaconda Navigator kann auch in der Befehlszeile/Terminal und im Anaconda PowerShell Prompt jederzeit mit dem Befehl …

anaconda-navigator

… geöffnet werden.

Verwenden der Anaconda-CLI in der Befehlszeile, Terminal und PowerShell.
Verwenden der Anaconda-CLI in der Befehlszeile, Terminal und PowerShell.
(Bild: Joos / Anaconda)

Parallel zu Anaconda Navigator ist es auch möglich, mit dem Kommandozeilen-Tool „conda.exe“ zu arbeiten. Mit diesem Tool können Aufgaben zur Verwendung von Anaconda in der Befehlszeile und dem Terminal vorgenommen werden. Dazu gehören zum Beispiel die Installation und Aktualisierung von Paketen, oder die Verwaltung der vorhandenen Pakete.

Mit „conda list“ zeigt das Tool die verknüpften/installierten Pakete der Umgebung und deren Version an. Der Befehl ist ein guter Test, um zu überprüfen ob Anaconda auf dem Computer richtig installiert ist und funktioniert. Zusätzlich existiert in Windows noch das „Anaconda PowerShell Prompt“. Dieses Tool öffnet das Anaconda Prompt, über das Conda ebenfalls verfügbar ist – auch dann, wenn Conda nicht in die Umgebungsvariablen hinzugefügt wurde.

Die Python-Shell steht in Anaconda ebenfalls zur Verfügung.
Die Python-Shell steht in Anaconda ebenfalls zur Verfügung.
(Bild: Joos / Anaconda)

Über das Anaconda PowerShell Prompt ist auch „python“ zu finden. Damit startet die Python Shell. Hier ist auch die installierte Python-Version zu sehen. Die Python Shell wird mit „quit()“ beendet. Neben dem Anaconda PowerShell Prompt kann über den Navigator die Umgebung auch auf Basis der Befehlszeile mit „CMD.exe Prompt“ gestartet werden.

Mit Anaconda arbeiten

Zusätzlich zur Integration von R und Python auf dem Computer und dem Zusammenfassen dieser Programmiersprachen und ihrer Pakete mit einem zentralen Verwaltungswerkzeug, können mit Anaconda auch zahlreiche Pakete und Lösungen installiert werden, die wiederum für Python und R nutzbar sind. Auch IBM Watson ist auf diesem Weg einsetzbar.

Wer sich etwas mit der Umgebung auseinandersetzt kann hier auch auf Lösungen der IBM Cloud setzen, auch auf die kostenlose Free-Tier-Variante. Hier stehen ebenfalls verschiedene Watson-Dienste kostenlos zur Verfügung. Damit können mit Anaconda auch Anwendungen zur künstlichen Intelligenz entwickelt werden.

Erstellen von neuen Environments in Anaconda.
Erstellen von neuen Environments in Anaconda.
(Bild: Joos / Anaconda)

Bei „Environments“ sind die einzelnen Pakete und deren Version zu sehen. Hier lassen sich Pakete auch aktualisieren, installieren oder entfernen. Mit „Create“ im unteren Bereich kann eine neue Umgebung erstellt werden, die wiederum Pakete für eine der beiden Programmiersprachen (R oder Python) und die ausgewählte Version enthält. Das ermöglicht das Arbeiten an unterschiedlichen Projekten, die mit Anaconda verwaltbar sind.

Diese Environments lassen sich auch exportieren und im kostenlosen Cloud-Speicher von Anaconda speichern. Die neue Umgebung ist unter „Environments“ zu sehen und ermöglicht ebenfalls den Start der verschiedenen Tools auf Basis der jeweiligen Umgebung, also zum Beispiel des Anaconda Prompts. Über den Anaconda Navigator lässt sich auch eine Python-Shell oder ein Anaconda Prompt öffnen.

Jupyter Notebooks mit Anaconda nutzen

Mit Anaconda können auch über den Navigator Jupyter Notebooks erstellt und genutzt werden. Die Installation von Jupyter erfolgt direkt im Dashboard des Navigators. Auf Anforderung kann Jupyter mit den entsprechenden Environments verknüpft werden. Auch das Exportieren und Teilen mit anderen Anwendern ist möglich.

Anaconda arbeitet mit IDEs wie Visual Studio zusammen.
Anaconda arbeitet mit IDEs wie Visual Studio zusammen.
(Bild: Joos / Anaconda)

Natürlich besteht auch die Möglichkeit, Anaconda direkt mit der jeweiligen IDE zu verknüpfen, die auf dem Computer installiert ist, zum Beispiel Visual Studio. Packages können auch mit der CLI installiert werden. Der Befehl zum Installieren eines Paketes sieht zum Beispiel folgendermaßen aus:

conda install anaconda-client

Packages, Environments und Notebooks teilen

Wie erwähnt, können Entwickler eigene Packages nach dem Hochladen ins Anaconda-Konto auch anderen zur Verfügung stellen. Gleiches gilt für Notebooks, die sich mit dem folgenden Befehl in den eigenen Bereich hochladen lassen, nachdem die Anmeldung mit dem Anaconda-Konto erfolgt ist:

anaconda upload my-notebook.ipynb

Nach dem Upload kann auch die HTML-Version des Notebooks angezeigt werden. Der Link dazu hat folgende URL: http://notebooks.anaconda.org/<USERNAME>/my-notebook

Wer Zugriff auf das Konto hat, kann hochgeladene Notebooks auch wieder herunterladen:

anaconda download username/my-notebook

Für das Hochladen von Packages muss im Anaconda Prompt zunächst mit „anaconda login“ eine Anmeldung erfolgen. Danach kann in der CLI ein selbst erstelltes Paket hochgeladen werden. Dazu steht zum Beispiel „conda-build“ zur Verfügung. Die folgenden Befehle installieren Conda-build, deaktivieren automatische Uploads und starten den Build:

conda install conda-build
conda config --set anaconda_upload no
conda build .

Die erstellte Datei des Packages zeigt der folgende Befehl an:

conda build . --output

Der Upload erfolgt zum Beispiel mit:

anaconda upload /your/path/conda-package.tar.bz2

Auch die erstellten Environments können in das eigene Anaconda-Konto hochgeladen werden. Dadurch steht die Umgebung entweder auch auf anderen Computern zur Verfügung, oder kann mit anderen Benutzern geteilt werden. Dazu lassen sich die Environments zunächst exportieren:

conda env export -n my-environment -f my-environment.yml

Die YAML-Datei kann danach mit Anaconda in den Cloudspeicher geladen werden:

anaconda upload my-environment.yml

Wer Zugriff auf das jeweilige Anaconda-Konto hat, kann seine gespeicherten Environments mit dem Link http://envs.anaconda.org/<USERNAME> aufrufen.

Fazit

Wer mit Python und R entwickelt und auch Anwendungen im Bereich von KI und Machine Learning schreibt, sollte sich die Möglichkeiten der kostenlosen Version von Anaconda anschauen. Der Vorteil des kostenlosen Kontos besteht darin, dass sich Packages, Daten, Notebooks und Einstellungen in die Cloud laden und auf anderen Rechnern herunterladen lassen. Das ermöglicht auch die Arbeit im Team.

Abbildungen

• anaconda-01.jpg - Anaconda-Umgebung mit R und Python installieren

• anaconda-02.jpg - Anaconda mit dem Navigator verwalten und zusätzliche Packages installieren.

• anaconda-03.jpg - Verwenden der Anaconda-CLI in der Befehlszeile, Terminal und PowerShell.

• anaconda-04.jpg - Die Python-Shell steht in Anaconda ebenfalls zur Verfügung.

• anaconda-05.jpg - Erstellen von neuen Environments in Anaconda.

• anaconda-06.jpg - Anaconda arbeitet mit IDEs wie Visual Studio zusammen.

 

(ID:47102812)

Über den Autor

 Thomas Joos

Thomas Joos

Freiberuflicher Autor und Journalist