Kopfweiden und Waldmoore – Kulturlandschaft und Klimaschutz am Beispiel des Biosphärenreservats Flusslandschaft Elbe

Datenanalyse von kleinklimatischen Messdaten mit "R"

„R“ ist eine Open Source Software zur Analyse und Darstellung von statistischen Daten und Grafiken. Die Programmiersprache wurde unter der GNU General Public License entwickelt und kann unter folgendem Link bezogen werden (vgl. http://www.r-project.org).

Der Vorteil der Programmiersprache R gegenüber einer Datenauswertung mit z.B. Excel besteht darin, dass große Datensätze einfach bearbeitet und ausgegeben werden können. Die jeweiligen Befehle können in einem Script gespeichert und somit auf beliebige Datensätze nachvollziehbar angewandt werden. Abb. 1 zeigt beispielhaft die Oberfläche von R Studio.

Abb. 1: Beispiel Oberfläche von R Studio

Die Datensätze stammen aus den mikroklimatischen Messungen, welche auf der Exkursionswoche vom 11. November 2014 bis 13. November 2014 im Mörickeluch mit Hilfe von drei automatischen Wetterstationen (AWS) gemessen wurden. Klimaelemente, wie die Lufttemperatur, relative Luftfeuchtigkeit, Globalstrahlung, Windgeschwindigkeit, Windrichtung und Niederschlagsereignisse wurden dabei aufgenommen.

Im Vordergrund von Tutorien, welche von Marco Otto und den Tutoren Patrick M. Weber und Carsten Vick geleitet und unterstützt wurden, standen neben dem Erlernen der Bedienung von R und der eigentlichen Datenanalyse auch das Verstehen der Programmfachbegriffe. Zudem wurde überlegt, welche Aussagen aus den analysierten Messdaten abgeleitet werden können.

Die Übungen zur statistischen Datenauswertung konzentrierten sich dabei auf die Ermittlung von Minimal- und Maximalwerten, dem Median, dem arithmetische Mittel und der Quartile. Darüber hinaus beschäftigten sich die Teilnehmer mit Streuungsmaßen, der Varianz und der Standardabweichung. Methoden, wie die Erstellung einer Korrelation zwischen zwei Werten und einer linearen Regression wurden verwendet, um die Aussagekraft der gemessenen Daten zu interpretieren. Dies kann auch über das Bestimmtheitsmaß R² geschehen, welches eine 
Aussage über die Qualität des Vergleichs zweier Werte erlaubt. Das Bestimmtheitsmaß ist 
ein Wert zwischen 1 (linearer Zusammenhang) und 0 (0 kein linearer Zusammenhang). Doch auch das Zuschneiden der Datensätze und die Ausgabe in Histogrammen, Plots, Scatter Plots und Windrosen wurden erprobt.

Datenanalyse und -ausgabe in R am Beispiel der Klimamessungen im Mörickeluch

Um gemessene Daten analysieren zu können, müssen Daten zunächst in R eingelesen werden. Eine Möglichkeit ist dabei die Erzeugung eines Vektors, bei dem Objekte zu einer endlichen Folge zusammengefasst werden. Einen Vektor erstellt man in R mit der Funktion c():

Beispiel: Lufttemperatur_AWS20 ← c(Daten)

Bei der Datenanalyse ist es wichtig, zunächst die gemessenen Daten auf Plausibilität zu überprüfen. Hierfür eignet sich der Befehl summary() oder str(), so gibt beispielsweise der summary() Befehl Auskunft über die Minimal- und Maximalwerte des Datensatzes und es kann beispielsweise der Zeitstempel der Messungen überprüft werden. Daten können so auch nachträglich in R prozessiert werden.

Bei den Datensätzen der Messungen im Mörickeluch ist hierbei beispielsweise aufgefallen, dass noch Messungen, die über den Messzeitraum im Mörickeluch hinausgingen, im Datenlogger gespeichert waren. Außerdem war es möglich, einen Fehler im Datenlogger zu beheben und die Daten der Messfühler der relativen Luftfeuchtigkeit neu zu kalibrieren.

Um mit den gemessenen Daten zu arbeiten, stellte der nächste Schritt die einheitliche Anpassung der Anfangs- und Endzeiten der drei AWS dar. Eine Möglichkeit ist dabei die Verwendung der min() und max() Befehle.

Die in R aufbereiteten Daten haben anschließend die Vorlage für die Erarbeitung eines wissenschaftlichen Artikels hinsichtlich einer individuellen Fragestellung gebildet. Die wissenschaftlichen Artikel können in der Navigationsleiste unter "Messungen im Mörickeluch" eingesehen werden.


QR-Code
QR-Code statistik_mit_r (erstellt für aktuelle Seite)