Will man einen Zusammenhang zwischen zwei metrischen Variablen untersuchen, zum Beispiel zwischen dem Alter und dem Gewicht von Kindern, so berechnet man eine Korrelation. Diese besteht aus einem Korrelationskoeffizienten und einem p-Wert. Der Korrelationskoeffizient gibt die Stärke und die Richtung des Zusammenhangs an. Er liegt zwischen -1 und 1. Ein Wert nahe -1 bezeichnet einen starken negativen Zusammenhang. Ein Wert nahe 1 spricht für einen starken positiven Zusammenhang. Kein Zusammenhang besteht, wenn der Wert nahe 0 liegt. Der p-Wert sagt aus, ob der Korrelationskoeffizient sich signifikant von 0 unterscheidet, ob es also einen signifikanten Zusammenhang gibt. Meistens werden p-Werte kleiner als 0,05 als statistisch signifikant bezeichnet. Es gibt verschiedene Korrelationskoeffizienten, die bei unterschiedlichen Daten eingesetzt werden. Ich stelle hier den Pearson-Korrelationskoeffizienten und den Spearman-Korrelationskoeffizienten vor.

Du willst mehr Durchblick im Statistik-Dschungel?

Der Pearson-Korrelationskoeffizient wird verwendet, wenn die Daten normalverteilt sind und wenn es einen linearen Zusammenhang zwischen den beiden Variablen gibt. Wie die Normalverteilung überprüft werden kann finden Sie in diesem Beitrag zu Normalverteilungsplots. Den linearen Zusammenhang checken Sie am besten mit einem Streudiagramm. Hier wird die eine Variable an der x-Achse, die andere an der y-Achse angetragen. Im Bild können Sie sehen, ob es einen linearen Zusammenhang zu geben scheint. Sie können außerdem schon erkennen, ob der Zusammenhang positiv oder negativ ist und ob es überhaupt einen deutlichen Zusammenhang gibt. Wenn die Daten nicht normalverteilt sind und/oder der Zusammenhang nicht linear ist, verwenden Sie die Spearman-Korrelation. Diese errechnet sich nicht direkt aus den Messungen, sondern aus den Rängen der Daten. Dadurch kann sie auch nicht-lineare Zusammenhänge erkennen und ist nicht auf normalverteilte Daten beschränkt.

Beide Methoden liefern Ihnen wie oben beschrieben einen Korrelationskoeffizienten für die Stärke und Richtung des Zusammenhangs sowie den p-Wert für die Signifikanz. Wie bei allen statistischen Verfahren ist es hilfreich, sich zusätzlich eine Abbildung anzusehen. In diesem Fall ist die passende Abbildung ein Streudiagramm, das den Zusammenhang anschaulich präsentiert.