Wenn du einen statistischen Vergleich von zwei Gruppen rechnen willst, hast du häufig eine metrische Variable, bei der dich der Unterschied in der Lage interessiert. Die Lage wird dabei beispielsweise mit dem Mittelwert (arithmetisches Mittel) oder auch mit dem Median (50 %-Quantil, mittlere Beobachtung) gemessen.

Oft zielt deine Hypothese dann darauf ab, zu untersuchen, ob es einen Unterschied dieser Variablen zwischen zwei Gruppen (z.B. Männer und Frauen) oder auch zwischen zwei Messwiederholungen (z.B. vor und nach der OP) gibt. Die Nullhypothese lautet in dem Fall dann „Es gibt keinen Lageunterschied zwischen den beiden Gruppen“ bzw. „Es gibt keinen Lageunterschied zwischen den beiden Messwiederholungen“. Der Signifikanztest versucht, diese Nullhypothese abzulehnen. Mit einem signifikanten p-Wert (p kleiner 5 %), wird genau das erreicht: ein signifikanter Unterschied wird nachgewiesen.

Aber welche Methode genau passt nun für diesen Test auf Lageunterschied?

Es gibt verschiedene Methoden, die verwendet werden können, um die Werte einer metrischen Variable von zwei Gruppen oder zwei Messwiederholungen auf Unterschied in der Lage zu untersuchen. Die Wahl des Tests hängt von der Art und der Verteilung der Daten ab.

Folgende Fragen musst du klären:

  1. Sind die Gruppen verbunden oder unverbunden?
  2. Sind die Werte für beide Gruppen normalverteilt? (zumindest wenn es sich um eine metrische Messung handelt)
  3. Falls unverbunden und normalverteilt: Sind die Varianzen gleich?

In folgendem Entscheidungsbaum siehst du, wie die Methode ausgewählt wird:

Entscheidungsbaum zur Auswahl des passenden Signifikanztests bei metrischen oder ordinalen Daten und zwei Gruppen oder zwei Messwiederholungen.

Ob die Daten verbunden oder unverbunden sind, entscheidest du über dein Studiendesign. Wenn du die Zielvariable zweimal am gleichen Unterschungsobjekt erhoben hast (z.B. bei Messwiederholungen, vor und nach der OP), dann sind die Daten verbunden. Wenn die Untersuchungsobjekte nur einmal gemessen wurden, sich aber in zwei verschiedenen „Töpfen“ befinden (z.B. Männer und Frauen), sind die Daten unverbunden.

Die Normalverteilung wird mittels Normalverteilungsplots (Q-Q-Plot, Q-Q-Diagramm) oder geeigneter Tests (z.B. Shapiro-Wilk-Test, Kolmogorov-Smirnoff-Test) untersucht. Ich empfehle generell eher die Normalverteilungsplots (Q-Q-Plot, Q-Q-Diagramm), da das Ergebnis der Tests auf Normalverteilung stark von der Fallzahl abhängt.

Die Entscheidung, ob bei den unverbundenen, normalverteilten Daten gleiche Varianzen vorliegen oder nicht, kannst du über einen Test auf Varianzhomogenität (z.B. Levene-Test) treffen. Oder du arbeitest hier deskriptiv und betrachtest die beiden Standardabweichungen.

Besonderheit ordinale Daten

Ist die Variable, die auf Lageunterschied untersucht werden soll, ordinal, so wird direkt die nicht-parametrische Methode (Wilcoxon, Mann-Whitney-U) verwendet werden. Eine Normalverteilung wird bei ordinalen Variablen nicht geprüft. Um ordinale Daten mit diesen Tests auf Lageunterschiede verwenden zu können, sollte sie nicht zu wenige Abstufungen haben. Also nicht beispielsweise nur 3 Stufen: klein/mittel/groß. Besser sind Variablen, die z.B. auf 7 Stufen oder mehr gemessen wurden. Dafür eignen sich die Tests auf Lageunterschiede besser.

Nicht vergessen: Deskriptive und Abbildungen

Grundsätzlich muss vor der Durchführung eines Tests die deskriptive Statistik berechnet werden. Das heißt, für beide Gruppen werden Mittelwert, Standardabweichung, Median, Interquartilsabstand berechnet. Außerdem empfehle ich, ein Diagramm mit zwei Boxplots oder Mittelwertsdiagramme mit Fehlerbalken zu erstellen. Anhand der Lage und Höhe der Boxen oder Streuungen lässt sich bereits erkennen, ob es in den Daten einen deutlichen Unterschied gibt.

Methodenauswahl

Hier nochmal die Auswahl der Tests im Überblick:

  • Sind die Stichproben unverbunden und normalverteilt, so wird der t-Test durchgeführt. Der t-Test setzt zusätzlich Gleichheit der Varianzen voraus, was zum Beispiel mittels Levene-Test untersucht wird. Sind die Varianzen nicht gleich, wird der Welch-Test verwendet.
  • Sind die Stichproben unverbunden und nicht normalverteilt oder ordinal, so wird der Mann-Whitney-U Test verwendet.
  • Sind die Stichproben verbunden und normalverteilt, so wird der gepaarte t-Test durchgeführt.
  • Sind die Stichproben verbunden und nicht normalverteilt oder ordinal, so nimmt man den Wilcoxon-Test.

Alle Tests geben die jeweilige Teststatistik und den p-Wert zurück. Ist der p-Wert kleiner als 0,05, so gibt es einen signifikanten Unterschied (signifikant auf dem Niveau 5 %). Ist der p-Wert größer als 0,05, so kann kein signifikanter Unterschied nachgewiesen werden (was nicht heißt, dass es keinen gibt).

Ergebnisse berichten

Berichtet wird zusätzlich zum p-Wert meist die Teststatistik (z.B. t oder z) und manchmal die Freiheitsgrade (wenn es sie gibt). Sinnvoll ist es außerdem, die Effektstärke zu berechnen (z.B. Cohens d), um zusätzlich zur Signifikanz noch eine Aussage zur Stärke des Unterschieds treffen zu können.

Mehr Gruppen vergleichen und mehr statistisches Know-How

Willst du mehr über weitere Gruppenvergleiche lernen oder hast Probleme, die passenden Methoden für andere Situationen auszuwählen? Dann hol dir mein Statistik-Starter-Paket gratis zum Download. Du findest in einem PDF und mehreren begleitenden Videos eine verständliche und praxisnahe Einführung in die grundlegenden statistischen Konzepte und lernst, die passenden Methoden für deine Datenanalyse sicher und zuverlässig auszuwählen.

Willst du noch mehr Material und gleich tiefer einsteigen? Dann passt die Statistik-Akademie gut für dich. Dort findest du zahlreiche Videos und Softwaretutorials, in denen ich dir verschiedenste statistische Methoden und Themen verständlich erkläre und dir auch die Umsetzung mit Software (R, SPSS, DATAtab, G*Power) zeige. Dazu bekommst du Handouts, Checklisten, Beispieldaten, SPSS-Syntax und R-Codes zum Download. Und im FAQ und Lexikon klärst du deine offenen Fragen zur Statistik ganz einfach selbst.

Interessiert? Dann schau dir die Statistik-Akademie hier genauer an (klick).