Statistik mit R

R (r-project.org) ist ein frei verfügbares Statistik-System, sehr umfangreich und beliebig erweiterbar. In vielen Bereichen entwickelt sich R zu dem Standard statistischer Datenanalyse.

  • R ist freie Software unter der GNU general public license. R ist kostenlos, auf beliebigen Rechnern nutzbar, im Studium wie auch im Beruf.
  • R wird nichtkommerziell von Freiwilligen entwickelt, vor allem Wissenschaftlerinnen und Wissenschaftlern, die mit Statistik arbeiten.
  • R enthält eine Vielzahl vorgegebener Funktionen für gängige Datenanalysen, bietet aber auch die Möglichkeit, neue statistische Funktionen selbst zu programmieren.

Auch in der Psychologie verbreitet sich R zunehmend mehr, ist aber im deutschsprachigen Raum noch nicht so gängig wie in anderen Wissenschaften (und wie im englischsprachigen Raum). Diese Seite enthält daher vor allem kommentierte Verweise zu Seiten und Dokumenten im Netz, die für psychologische Statistik mit R nützlich sein können.

R-Einstieg

  • R-Projekt - Startseite (englischsprachig, das Programm kann aber auf Deutsch und in anderen Sprachen arbeiten)
  • R herunterladen von CRAN, dem Comprehensive R Archive Network [gespiegelte Seite bei der ETH Zürich]
    (installierbare Versionen für Mac OS X, MS Windows, Linux; Linux-Distributionen enthalten R aber meist ohnehin schon)
  • R-Einführung der ETH Zürich: deutschsprachig, sehr gut ohne Vorkenntnisse lesbar (pdf, 230 kB)
  • An Introduction to R: das "offizielle" Einführungsdokument (englischsprachig) [ pdf-Version, 630 kB]
    Ist R bereits installiert, so sind dieses Manual und andere Hilfe-Dokumente (FAQ, Daten-Import/Export) dabei enthalten und müssen nicht extra heruntergeladen werden.

R-Einstieg für SPSS-Erfahrene

Gegenüberstellungen und Anleitungen für Personen, die mit SPSS gearbeitet haben und sich für R interessieren:

  • R for SAS and SPSS users: vergleichende Einführung mit umfangreichen Syntax-Gegenüberstellungen (Bob Muenchen, University of Tennessee, Knoxville). [ pdf-Version, 470 kB] (dies ist 2008 in erweiterter Form als Buch bei Springer erschienen)
  • Quick-R for SAS/SPSS/Stata users
  • R relative to statistical packages: Diskussion grundlegender Eigenschaften von R im Vergleich zu Statistik-Paketen wie Stata, SAS, SPSS (Patrick Burns; pdf, 80 kB)

R in der Psychologie

Literaturempfehlungen

  • Dalgaard, P. (2008). Introductory Statistics with R. New York, NY: Springer.
    Einführung zur Umsetzung elementarer und multivariater statistischer Verfahren in R; grosser Überschneidungsbereich zu Verfahren in der Psychologie, mit Grundkenntnissen psychologischer Statistik sehr gut lesbar
  • Everitt, B. S., & Hothorn, T. (2009). A Handbook of Statistical Analysis Using R. Boca Raton, FL: Chapman & Hall/CRC.
    An ausführlichen Beispielen orientierte Darstellung einer Vielzahl statistischer Verfahren, geht über übliche psychologische Statistik-Veranstaltungen deutlich hinaus und behandelt auch in Lehrbüchern oft vernachlässigte Themen (Meta-Analyse) und in der Psychologie selten zu findende Verfahren (z.B. Rekursives Partitionieren, Generalisierte Additive Modelle)
  • Verzeichnis von Büchern zu R auf r-project.org (mehrheitlich englischsprachig)
  • Contributed Documentation auf r-project.org (von Tutorien bis zu kompletten Büchern; neben Englisch in vielen weiteren Sprachen)

Weitere nützliche Quellen

Deutschsprachig:

  • Datenanalyse und Graphik mit R: Skript, das vom Umfang schon ein elementares Arbeitsbuch darstellt; für das Biologie-Studium, doch mit grossem Überschneidungsbereich zu elementarer Statistik in der Psychologie (Bernhard Klar, Universität Karlsruhe; pdf, 950 kB)
  • Statistik mit R: Seminarmaterial für die Psychologie (Erwin Grüner, Universität Marburg)
  • R-Einführungsbuch: zur Statistik-Grundausbildung für Wirtschaftswissenschaften (Andreas Handl, Universität Bielefeld; pdf, 2 MB)
  • Statistical Computing: Einführung in R: eher mathematisch ausgerichtet, Programmier-Grundkenntnisse hilfreich (Günther Sawitzki, Universität Heidelberg; pdf, 9 MB)

Suche zu R-Themen

Bei Fragen einfach "R" in google einzugeben, ist naturgemäss zu unspezifisch. Um R-relevante Ergebnisse zu erhalten, kann man dagegen in Suchmaschinen als zusätzlichen Suchbegriff "r-project.org" eingeben. Eine Suche, die auf die Website des R-Projekts beschränkt ist, funktioniert mit "site:r-project.org".

Ausserdem gibt es eine Reihe spezifischer Such- und Hilfe-Möglichkeiten:

Grafische Oberflächen für R

Es gibt grafische Oberflächen als Zusatzpakete zu R, die Menüs für gängige Statistik- und Grafik-Funktionen bieten, wie man sie von anderen Statistik-Programmen kennt. Für den Einstieg/Umstieg von Menü-orientierten Statistik-Programmen kann dies sehr hilfreich sein. Solange man keine sehr komplexen Analysen durchführen möchte, kann die grafische Oberfläche auch auf Dauer ausreichen.

  • R Commander: Grafische Oberfläche zu R mit Menüs für viele gängigen Statistik- und Grafik-Funktionen (Betriebssystem-unabhängig, unter Linux, Mac OS X, MS Windows gleichermassen einsetzbar)
    [R Commander herunterladen von CRAN]
  • RKWard: Grafische Oberfläche zu R mit umfangreichen Menüs für Statistik- und Grafik-Funktionen sowie Integration von Datenverwaltung und HTML-Output (für die grafische KDE-Desktop-Umgebung unter Linux; inzwischen ist auch eine RKWard-Version für KDE unter Windows verfügbar)

Mit R lassen sich aber auch aufwendige und komplexe Analysen programmieren, die man nicht in Form von Menüs vorhersehen könnte. Von daher können auch modular erweiterbare grafische Oberflächen für R (wie RKWard) nicht von vornherein den gesamten Funktionsumfang von R abdecken. Dies spricht nicht gegen R, sondern für seine praktisch unbegrenzt erweiterbaren Möglichkeiten.

Der R Commander bietet auch dadurch einen guten Einstieg, dass er beim Aufruf von Menü-Funktionen die ausgeführte R-Syntax anzeigt und so damit vertraut macht. Mit RKWard ist ebenso eine Ausgabe der Syntax möglich.

Text-Editoren für R

Die Mac OS X- und MS Windows-Versionen von R besitzen einen integrierten Text-Editor zum Schreiben von Skript-Dateien mit R-Syntax. Aus diesem Editor können mit Tastaturkürzeln oder Mausklicks einzelne Zeilen, markierte Bereiche oder die komplette Datei ausgeführt werden. Für einfache Analysen kann auch eine Menü-orientierte grafische Oberfläche ausreichen.

Für komplexe und häufige Analysen ist es aber komfortabler, einen separaten Text-Editor zu benutzen, der direkt mit R zusammenarbeitetn kann. Unter Linux, wo R keinen integrierten Editor bietet, ist ein externer Editor ohnehin empfehlenswert. Dies ermöglicht

  • gezieltes Ausführen einzelner Zeilen oder markierter Bereiche einer Syntaxdatei und
  • übersichtliche farbliche Syntax-Hervorhebung, z.B. von R-Funktionsnamen, Klammern, Anführungszeichen, Kommentaren, was häufige "Anfängerfehler" (wie vergessene Klammern und Anführungszeichen) zu vermeiden hilft.

Beispiele solcher Editoren sind Emacs/XEmacs, Tinn-R und WinEdt.

Emacs und XEmacs sind an sich Unix-Programme, die aber ebenso für Windows und Macintosh erhältlich sind. Sie sind freie Software. Der ESS-Statistikmodus von Emacs/XEmacs bietet hervorragende Unterstützung für R (und andere Statistik-Programme) und ist für ernsthafte Benutzung sehr empfehlenswert. Für Windows-Benutzer können allerdings die (X)Emacs-Tastaturkürzel anfangs ungewohnt sein.

Auf Windows-Benutzer ausgerichtete Möglichkeiten sind der Editor Tinn-R (spezifisch auf die Benutzung mit R zugeschnitten) sowie der (Shareware-)Editor WinEdt, für den es ein Zusatzpaket zur Zusammenarbeit mit R gibt.

  • GNU Emacs Text-Editor (für viele Betriebssysteme, darunter Linux, Mac OS X, MS Windows)
  • XEmacs Text-Editor (für viele Betriebssysteme, darunter Linux, Mac OS X, MS Windows)
  • ESS-Modus zur Benutzung von R direkt aus (X)Emacs
  • Tinn-R R-spezifischer Text-Editor (für MS Windows)
  • WinEdt Text-Editor (für MS Windows)
  • R-Paket für WinEdt

Anregungen und Ergänzungen zu dieser Seite sind willkommen! Kontakt