Erste Schritte mit R für Praktiker in den Biowissenschaften

V. Kiefel

04. März 2018

Contents

1  Hinweise zum Nachvollziehen der Beispiele
2  Ein-Stichproben-Analyse
    2.1  Perzentilen, Histogramm
    2.2  Mittelwert, Median und Standardabweichung
3  Einfache lineare Regression, Korrelationskoeffizient, Daten von einer Datei einlesen
4  Messung der Übereinstimmung der Beurteilung
    4.1  Cohens Kappa
    4.2  Spearmans Rangkorrelationskoefizient
5  Kontingenztafeln
    5.1  Chiqudadrat-Test
    5.2  Prüfung von k×2-Feldertafeln auf Trend
    5.3  `Fisher's exakter Test '
    5.4  Odds ratio
6  Vertrauensgrenzen relativer Häufigkeiten bei binominalverteilter Grundgesamtheit
7  Vergleich mehrerer Gruppen
    7.1  Einfache Varianzanalyse
    7.2  Bartlett Test
8  `Goodness of fit '-Tests (Anpassungstests an bekannte Verteilungen)
    8.1  Kolmogorov-Smirnov Test für die Güte der Anpassung
    8.2  Shapiro-Wilk-Test
    8.3  Überprüfung von Genotyp-Häufigkeiten auf Vorliegen eines Hardy-Weinberg-Gleichgewichts
9  Vergleich von zwei unabhängigen Stichproben mit dem t-Test
10  Vergleich zweier abhängiger Stichproben im t-Test
11  Wilcoxon-Test für unabhängige Stichproben
12  Friedman-Test
13  H-Test (Kruskal-Wallis)
14  Überlebenszeit-Analyse
    14.1  Beispieldaten aus der R-Implementation benutzen
    14.2  Kaplan Meier-Kurve, Daten aus eigener Datentabelle einlesen
15  Statistische Funktionen
    15.1  Chiquadrat-Verteilung
    15.2  F-Verteilung
    15.3  t-Verteilung (Student)
    15.4  Standardnormalverteilung
16  Bestimmung einer nowendigen Stichprobengrö ße
    16.1  Vergleich zweier Mittelwerte
    16.2  Vergleich zweier relativer Häufigkeiten
17  Metaanalyse
18  Erstellung von Grafiken
    18.1  Säulendiagramme
    18.2  Farben und andere Grafikparameter
    18.3  Boxplots
    18.4  Scatterplots
    18.5  Stripchart (eindimensionaler Scatterplot)
    18.6  Linien verbinden Werte von beliebig vielen Individuen, die zwei oder mehr Zeitpunkten oder Wiederholungen entsprechen
        18.6.1  Allgemeine Konstruktion mit plot()
        18.6.2  Konstruktion ähnlicher Diagramme mit interaction.plot()
19  Verschiedenes
    19.1  Berechnung der Determinante einer Matrix
    19.2  Datumsberechnungen
20  Anhang
    20.1  Hinweise für R unter Linux
        20.1.1  Installation
        20.1.2  R konfigurieren
        20.1.3  PDF-, PostScript- und EPS-Dateien von Abbildungen erstellen.
    20.2  Allgemeine Befehle
    20.3  Einstellen von Optionen des Systems
    20.4  Textdarstellung von R-Objekten als Textdatei speichern und wieder einlesen
    20.5  Datendateien für R formatieren
    20.6  Quellcodes
        20.6.1  ToR.awk
        20.6.2  Perc.R
21  Versionen
Index

Vorwort

Das vorliegende Manuskript ist eine kleine willkürlich zusammengestellte Sammlung von ,,Kochrezepten'' für die Anwendung von R1 mit Verfahren, wie sie von Biowissenschaftlern und Medizinern ständig benötigt werden. Dieser Text wurde in der Absicht geschrieben, dem Benutzer die allerersten Schritte mit R anhand von ihm vertrauten Problemen zu erleichtern. Vor allem benötigt man häufig in der Eile ein Beispiel, anhand dessen man rasch die Eingabe der Daten und die Formulierung einer Auswertung ausführen kann. In diesem Sinne dient dieses Manuskript auch dem Autor als Gedächtnisstütze.
Es empfiehlt sich dringend, parallel zum Ausprobieren der Beispiele zu wichtigen Funktionen die R-Dokumentation zu lesen, um zu erkennen, wie die in diesem Text verwendeten Lösungen in der oft sehr knappen Beschreibung ,,aussehen''. So wird man dann lernen, alternative und möglicherweise bessere Lösungen zu finden.
Das Manuskript ersetzt nicht die ausgezeichnete Dokumentation zur Beschreibung von R und es ersetzt nicht Lehrbücher oder Originalarbeiten zu statischen Methoden. Vor oder gleichzeitig mit diesem Dokument sollte man sich mit elementaren Datenstrukturen und Funktionen vertraut machen, darunter Vektoren, Listen, Arrays, ,,data frames'', read.table(), c(), z. B. in dem Dokument ,,An introduction to R'' des R development core teams, das jeder Installation von R beigefügt ist [1]. Installation und Nutzung der Windows-Version von R dürften weitgehend selbsterklärend sein. Hinweise auf Besonderheiten von R unter Linux finden sich in Abschnitt 20.1.
Für die Richtigkeit der in diesem kleinen Manuskript gemachten Angaben wird keine Gewähr übernommen. In fast allen Fällen ist der beschriebene Weg zur Dateneingabe nicht der einzig mögliche. Bei zunehmender Vertrautheit mit R sollte die Originaldokumentation und Fachliteratur zu den zugrundeliegenden statistischen Verfahren zu Rate gezogen werden! Empfehlenswerte Texte für den Einstieg in elementare Verfahren anhand von R sind [1,2,3].


Kritzmow bei Rostock, im März 2018
V.K.

HEAD NEXT