Wird die Varianzanalyse (ANOVA) signifikant, so interessieren in Anschluss oft noch die Paarvergleiche zwischen den einzelnen Gruppen, um herauszufinden, wo genau der Unterschied liegt. SPSS stellt hier im Menü eine Vielzahl von Tests zur Verfügung. Welchen davon sollen Sie verwenden? Welche Methode passt wann?

Wozu sind überhaupt besondere Methoden notwendig?

Warum hier überhaupt besondere Methoden notwendig sind und nicht einfach mit den „normalen“ Tests die Paarvergleiche gerechnet werden dürfen, lesen Sie in diesem Artikel nach. Kurz hier zusammengefasst: Wenn nach der ANOVA noch Paarvergleiche gerechnet werden, handelt es sich um multiples Testen. Dadurch erhöht sich der Fehler und dies muss korrigiert werden.

3 Kriterien für Post-Hoc-Tests

Nach folgenden drei Kriterien wird ein Post-Hoc-Test beurteilt:

  • Wie streng wird der Fehler 1. Art kontrolliert?
  • Wie streng wird der Fehler 2. Art kontrolliert?
  • Ist der Test robust (z.B. auf Verletzung der Normalverteilung, auf ungleiche Varianzen, ungleiche Stichprobengrößen usw.)?

Je nachdem, wie die Tests diese Kriterien erfüllen, werden sie für die jeweilige Situation ausgewählt.

Post-Hoc-Tests zur Auswahl in SPSS

In SPSS (Version 22) stehen aktuell für die ANOVA die hier abgebildeten Post-Hoc-Tests zur Verfügung (Screenshot aus dem Menü EINFAKTORIELLE VARIANZANALYSE, die Auflistung über das Menü UNIVARIAT enthält die gleichen Methoden):

Screenshot-PostHoc-EinfaktVarianzanalyse

Einige Methoden aus SPSS und deren Kriterien

Hier möchte ich zu ein paar dieser Methoden die Kriterien nennen. Aufgrund der Vielzahl der Methoden wähle ich nur ein paar wenige aus.

LSD (Least significant difference) und S-N-K (Studentized Newman-Keuls): keine Kontrolle des Fehlers 1. Art, deshalb zu liberal.

Bonferroni und Tukey: sehr strenge Kontrolle des Fehlers 1. Art, zu geringe Teststärke, deshalb zu konservativ. Bei wenigen Paarvergleichen hat Bonferroni mehr Teststärke, bei vielen Paarvergleichen hat Tukey mehr Teststärke.

Tamhane-T2, Dunnett-T3, Dunnett-C: robust bei ungleichen Varianzen, aber zu konservativ.

Vereinfachte Empfehlungen

Aufgrund der Vielfalt der Methoden und deren Eigenschaften fasse ich hier vereinfacht Empfehlungen zur Verwendung der Post-Hoc-Tests zusammen. Sie basieren auf den Empfehlungen von Andy Field (2013).

  • Gleiche Varianzen und gleiche Fallzahl: Q nach R-E-G-W
  • Gleiche Varianzen und leicht unterschiedliche Fallzahl: Gabriel
  • Gleiche Varianzen und stark unterschiedliche Fallzahl: GT2 nach Hochberg
  • Ungleiche Varianzen (gleiche oder ungleiche Fallzahl): Games-Howell

Post-Hoc-Tests und Normalverteilung

Alle diese Tests sind als Post-Hoc Analysen bei der ANOVA gedacht. Das heißt, sie setzten damit auch Normalverteilung voraus. Allerdings haben Simulationen gezeigt, dass sie – genauso wie die ANOVA – robust auf die Verletzung der Normalverteilung reagieren.

Als Paarvergleichstests nach nichtparametrischen Methoden sind sie trotzdem nicht geeignet. Hier stellt SPSS keine automatischen Post-Hoc-Tests zur Verfügung. Stattdessen müssen die Paarvergleiche mit „herkömmlichen“ Tests (Mann-Whitney U, Wilcoxon) durchgeführt werden und die Fehlerkorrektur von Hand berechnet werden, zum Beispiel mit der Bonferroni-Holm-Methode, siehe Blogbeitrag dazu.

Literatur: Andy Field, Discovering Statistics Using SPSS, Sage, 2013