Bei metrischen Variablen gibt es verschiedene Möglichkeiten in einer Abbildung zu veranschaulichen, inwieweit sich zwei Stichproben unterscheiden. Entscheidend ist hier, dass ein Maß für die Streuung mit verwendet wird (z.B. als Fehlerbalken). Bei nichtschiefen Verteilungen eignen sich dafür z.B. die Standardabweichung (standard deviation, SD), der Standardfehler des Mittelwerts (standard error of the mean, SEM) und das 95%-Konfidenzintervall (95% confidence interval, 95%-CI).Vergleich der Darstellung mit SD, SEM und Konfidenzintervall

Abbildung der Daten aus Vitamin D Studie (Cockburn et al., 1980): Mittelwerte der Plasmakonzentrationen von Neugeborenen mit SD, SEM und Konfidenzintervall.

Standardabweichung

Sehr geläufig ist die Standardabweichung. Sie beschreibt die Schwankung der Messwerte um den Mittelwert und ist die größte der drei hier vorgestellten Messwerte. Sie wird gerne angegeben, da sie direkt verwendet werden kann, um Signifikanztests auf die Daten zu berechnen. Allerdings gibt sie graphisch keinen direkten Hinweis auf Gruppenunterschiede.

 

Du willst mehr Durchblick im Statistik-Dschungel?

Standardfehler des Mittelwerts

Der SEM ist der kleinste Wert hier. Vielleicht wird er deshalb gerne in Grafiken eingesetzt, um einen nicht so deutlichen Unterschied deutlicher erscheinen zu lassen?!

95%-Konfidenzintervall

Das 95%-Konfidenzintervall ist meiner Meinung nach die wertvollste Möglichkeit der Darstellung von Streuung in solch einer Abbildung, denn es gibt einen direkten Zusammenhang zum p-Wert eines Signifikanztests: Überlappen sich die beiden Konfidenzintervalle in der Abbildung nicht, so ist der p-Wert des Tests kleiner 0,05 und es gibt einen signifikanten Unterschied zwischen den beiden Gruppen.

Referenzen

Cockburn et al. (1980). Maternal vitamin D intake and mineral metabolism in mothers and their newborn infants. Br. Med. J., 281, 11-14.

Stuart J. Pocock (1983). Clinical Trials. A Practical Approach. John WIley & Sons.