Schiefe (Skew) und Exzess (Kurtosis) sind Maße, die die Abweichung einer Verteilung von der Normalverteilung beschreiben.

Schiefe

Die Schiefe gibt dabei an, ob die Verteilung symmetrisch ist oder nicht.

Eine positive Schiefe beschreibt dabei rechtsschiefe Daten (links steil, rechts schief). Hier gibt es viele kleine Werte in den Daten.

Eine negative Schiefe beschreibt linksschiefe Daten (links schief, rechts steil). Hier kommen viele große Werte vor und weniger kleine Werte.

Linkssteile, rechtsschiefe Verteilung

Rechtssteile, linksschiefe Verteilung

Exzess (Kurtosis)

Der Exzess gibt dagegen die Wölbung an und beschreibt, ob die Verteilung im Gegensatz zur Normalverteilung spitz oder abgeflacht ist.

Eine spitze Verteilung hat einen positiven Exzess. Hier liegen dann mehr Beobachtungen als gewöhnlich in den Enden der Verteilung, weshalb diese auch heavy-tailed genannt wird.

Ein negativer Exzess beschreibt eine abgeflachte Verteilung. Eine solche Verteilung hat im Vergleich zur Normalverteilung dünne Enden (light-tailed).

Spitze Verteilung mit dicken Enden

Flache Verteilung mit dünnen Enden

Du willst mehr Durchblick im Statistik-Dschungel?

Was ist normal?

Bei normalverteilten Werten sind sowohl Exzess als auch Schiefe gleich 0. Je weiter die Werte von der Null entfernt sind, umso weniger wahrscheinlich sind die Daten nicht normalverteilt.

Folgendermaßen kannst du prüfen, ob der Wert (Exzess oder Schiefe) signifikant von der 0 abweicht und somit signifikant keine Normalverteilung vorliegt:

Teile den Wert durch seinen Standardfehler, nimm den Betrag des Ergebnisses. Ist dieses Ergebnis größer als 1.96, so liegt eine signifikante Schiefe bzw. ein signifikanter Exzess vor (zum Signifikanzniveau von 5 %).

Im Beispiel hier liegt eine Schiefe von 1.209 vor mit einem Standardfehler von .193. Der Quotient aus beiden ergibt also 1.209/.193 = 6.26 und damit einen Wert über der Grenze 1.96. Die Verteilung hat also eine positive Schiefe (links steil, rechts schief), die signifikant von der 0 abweicht.

Für den Exzess (= Kurtosis) ergibt sich der Quotient 1.754/.384 = 4.57. Auch hier liegt also eine signifikante positive Abweichung von der 0 vor (spitz, mit dicken Enden).

Das Histogramm zu diesem Beispiel mit Normalverteilungskurve sieht so aus:

Solche Prüfungen auf signifikante Abweichungen sollten aber mit Vorsicht verwendet werden. Bei großen Stichproben werden auch kleine Abweichungen als signifikant erkannt. In diesen Fällen also lieber die grafische Einschätzung der Normalverteilung – einen Q-Q-Plot – verwenden.