Suchen

Statistikumgebung und Programmiersprache Überblick zu „R“ und RStudio

| Autor / Redakteur: Thomas Joos / Stephan Augsten

Als Programmiersprache und Statistikumgebung richtet sich „R“ vornehmlich an Datenwissenschaftler. Gleichsam profitieren Entwickler, die Daten analysieren und statistische Programme entwickeln oder Lösungen in diesem Bereich anbieten. Wir geben einen ersten Überblick.

Firma zum Thema

Mit RStudio gelingt der Einstieg in R einfacher als ohne passende IDE. Eine Desktop-Version steht kostenlos zur Verfügung.
Mit RStudio gelingt der Einstieg in R einfacher als ohne passende IDE. Eine Desktop-Version steht kostenlos zur Verfügung.
(Bild: Joos / RStudio)

Die Programmiersprache und Statistikumgebung R steht als Open Source zur Verfügung. Die kostenlose Programmiersprache R wurde auf Basis der kommerziellen Statistiksprache „S“ erstellt. R ist modular aufgebaut und kann mit Packages erweitert werden.

Generell gilt R als eher schwer zu erlernen. Durch den modularen Aufbau und den damit zur Verfügung stehenden Packages lassen sich aber in den meisten Fällen bereits fertige Pakete mit RStudio integrieren und produktiv nutzen. Für fast alle Ansätze, die es in der Statistik gibt, stehen auch fertige R-Packages oder zumindest Code-Beispiele zur Verfügung.

Bildergalerie
Bildergalerie mit 6 Bildern

R und RStudio in Windows, Linux und macOS nutzen

R kann in Windows, Linux und macOS installiert werden. Der Download erfolgt direkt auf der R-Projektseite. Wer mit R arbeitet, nutzt in den meisten Fällen auch eine Programmierumgebung. Beim Einsatz von R wird häufig auf RStudio gesetzt. Die Edition „RStudio Desktop“ steht dabei kostenlos zur Verfügung.

R ist im Bereich der Datenanalyse und Statistik eine feste Größe geworden. Daher wurde zum Beispiel auch in Microsoft SQL-Server eine Schnittstelle integriert, mit der über R auf die Daten von Datenbanken auf SQL-Servern zugegriffen werden kann. Es ist also kein Export und Import der Daten mehr notwendig, R-Programme können ihre Daten direkt aus dem SQL-Server auslesen.

R und Microsoft SQL Server

Microsoft stellt dazu seit SQL Server 2016 einen speziellen R-Client zur Verfügung. Darüber können Anwender oder Entwickler mit R-Skripten direkt von jedem Computer aus sicher auf die Daten eines SQL-Servers zugreifen.

Der R-Client optimiert die Ausführung der R-Skripte. Dazu können auch mehrere Threads auf einmal gestartet werden. Diese überträgt der R-Client auf den SQL-Server und führt diese direkt auf dem Server aus. Das geht natürlich deutlich schneller, als die Ausführung von einzelnen Aufgaben auf dem Client und dem Abrufen von Daten vom Server.

RStudio Desktop installieren und nutzen

Wer sich mit R beschäftigt, sollte mit RStudio beginnen. In der grafischen Oberfläche ist es leichter sich in die Umgebung einzuarbeiten. RStudio Desktop steht kostenlos zur Verfügung und ist in Windows, Linux und macOS schnell einsatzbereit. Zum Erlernen von R ist das natürlich hilfreich.

Über den Menüpunkt „Tools“ steht „Global Options“ zur Verfügung. Hierüber kann RStudio an die eigenen Anforderungen angepasst werden. Im Rahmen der Installation von RStudio gehört nicht die Installation von R selbst. Vor dem Start von RStudio sollte daher zunächst R installiert werden.

Nach dem Start von RStudio ist links die Registerkarte „Console“ zu finden. Hier werden die R-Befehle eingegeben, die in RStudio ausgeführt werden sollen. In R können auch Rechenaufgaben direkt eingegeben werden, zum Beispiel „2+3“, „exp(1)“ oder „pi“.

Im rechten oberen Bereich sind auf der Registerkarte „Environment“ die gesetzten Variablen zu sehen sowie definierte Datensätze und Funktionen. Durch einen Klick auf „Global Environment“ erscheint ein Drop-Down-Menü. Hier sind die Packages zu sehen, die geladen wurden. Bei „History“ sind die zuletzt ausgeführten R-Befehle zu sehen, wenn die Konsole gelöscht wurde.

Rechts unten sind weitere Menüpunkte zu sehen. Hier können mit „Files“ die Dateien verwaltet werden, die für das jeweilige R-Projekt genutzt werden. In welchem Verzeichnis man sich gerade befindet, kann in der Konsole mit „getwd()“ angezeigt werden. Ändern lässt sich das Verzeichnis mit:

set(<Verzeichnis>)

Packages installieren

Für viele Vorgänge gibt es in R bereits fertige Packages. Dies zeigt sich am Beispiel des RStudio-Tutorials. Ruft man dieses über die Registerkarte „Tutorial“ auf, werden kurzerhand einige Packages nachinstalliert. Sobald alle Packages für das Tutorial heruntergeladen wurden, kann das Tutorial in RStudio gestartet werden.

Diese Vorgehensweise kann generell für andere Packages in RStudio vorgenommen werden, die Packages lassen sich aber auch in der R-Konsole manuell installieren. Soll zum Beispiel das Package „tidyverse“ installiert werden, mit dem sich Daten verarbeiten lassen, wird in der Konsole der folgende Befehl eingegeben:

install.packages("tidyverse")

Um das Package zu laden, wird der folgende Befehl verwendet:

library(tidyverse)

Packages können aber auch in RStudio gesucht und geladen werden. Die Registerkarte „Packages“ zeigt die verfügbaren Pakete zu sehen und bietet eine integrierte Suche an. Über die Schaltfläche „Install“ wird ein Package installiert, die Schaltfläche „Update“ aktualisiert ein bereits installiertes Package.

Hilfe in R abrufen

Da R relativ komplex ist, dürfte es schwerfallen, sich alle notwendigen Funktionen zu merken. Auf der Registerkarte „Help“ findet sich dementsprechend ist eine ausführliche Hilfe zu R zu finden. Hier sind auch Links zu Anleitungen im Internet hinterlegt. Auf der Registerkarte ist auch ein Suchfeld zu finden, mit dem bestimmte Begriffe direkt recherchiert werden können.

Auch in der Konsole kann eine Hilfe angezeigt werden. Dazu wird entweder der Befehl „help“ oder das Zeichen „?“ verwendet, zum Beispiel „help()“ oder „?(tidyr)“. Die Hilfe wird anschließend ebenfalls auf der Registerkarte „Help“ in RStudio eingeblendet.

Projekte erstellen

In RStudio wird mit „Projekten“ gearbeitet. Ein Projekt enthält nicht nur den R-Code, sondern auch alle dazu notwendigen Dateien. Neue Projekte können über den Menüpunkt „File“ erstellt werden, oder über den Projekt-Menüpunkt rechts oben in RStudio. Hier können Projekte auch geöffnet oder geschlossen werden, um ein weiteres Projekt zu laden.

(ID:46834138)

Über den Autor

 Thomas Joos

Thomas Joos

Freiberuflicher Autor und Journalist