Was ist ein Profilplot?
In einem Profilplot sind die Mittelwerte der abhängigen Variable für die einzelnen Kategoriekombinationen Deiner Gruppenfaktoren getrennt dargestellt. Dabei befinden sich die Kategorien des einen Gruppenfaktors an der x-Achse, die des anderen Gruppenfaktors in einer farbigen Lebende (ich gehe der Einfachheit halber davon aus, dass es sich um eine ANOVA mit zwei Faktoren handelt). An der y-Achse ist die abhängige Variable angetragen.
Bei einer zweifaktoriellen ANOVA erstellst Du zwei Profilplots. Im ersten Profilplot ist Faktor A an der x-Achse und Faktor B als farbiger Code in der Legende. Im zweiten Profilplot ist es umgekehrt.
Was kann ich am Profilplot ablesen?
Du untersuchst am Profilplot, ob die Haupteffekte Deiner beiden Faktoren in der berechneten ANOVA interpretierbar sind. Kreuzen sich die Linien der Kategorien eines Faktors, so ist der Haupteffekt durch die Interaktion gestört und nicht wie in der ANOVA berechnet interpretierbar.
In den obigen Beispielen wird in Abbildung 1 untersucht, ob der Haupteffekt des Faktors „Alcohol Consumption“ interpretierbar ist. Dazu betrachtest Du das Bild um zu sehen, ob sich die Linien kreuzen. Das tun sie nicht (oder nur sehr knapp). Das bedeutet, dass die Reihenfolge der mittleren Ausprägungen der abhängigen Variable in den Kategorien des Faktors „Alcohol Consumption“ bei jeder der Kategorien des Faktors „Gender“ gleich bleibt: grün hat immer den höchsten Wert, blau den zweithöchsten und gelb den niedrigsten Wert. Damit ist der Haupteffekt von „Alcohol Consumption“, der in der ANOVA berechnet wurde, interpretierbar, auch wenn die Interaktion signifikant ist. Die Interaktion stört den Haupteffekt nicht.
Anders ist das in Abbildung 2. Hier ist Legende und x-Achse nun vertauscht. Die Linien beschreiben die Kategorien des Faktors „Gender“. Hier kreuzen sich die Linien. Das bedeutet, die Reihenfolge der beiden Gender-Kategorien ist nicht in jeder Kategorie von „Alcohol Consumption“ gleichbleibend. Mal hat Male höhere Werte, mal hat Female höhere Werte. Damit ist der Haupteffekt von „Gender“, der in der ANOVA berechnet wurde, nicht interpretierbar, wenn die Interaktion signifikant ist. Die Interaktion stört den Haupteffekt.
Du willst mehr Durchblick im Statistik-Dschungel?
Die Linien kreuzen sich. Was nun?
Noch einmal: das Kreuzen der Linien im Profilplot ist nur ein Problem wenn
- die Interaktion signifikant ist und
- Du an der Interpretation der Haupteffekte interessiert bist.
Zudem ist immer nur der Haupteffekt nicht interpretierbar, bei dem sich die Kategorien-Linien im Profilplot kreuzen. So wie im obigen Beispiel ist der Haupteffekt von „Alcohol Consumption“ sehr wohl interpretierbar, weil sich die Alcohol-Consumption-Linien nicht kreuzen. Der Haupteffekt von „Gender“ ist nicht interpretierbar, weil sich die Gender-Linien kreuzen. Beide gehören aber zur gleichen Interaktion!
Wenn Du aber nun einen Haupteffekt, wie zum Beispiel hier den von „Gender“ interpretieren willst und weißt nun durch die Profilplots, dass Du dafür das Ergebnis der ANOVA nicht verwenden kannst, dann solltest Du Deine Daten sinnvoll aufteilen und den Haupteffekt von Gender auf Teildatensätzen untersuchen. In dem Beispiel bietet es sich an, den Datensatz nach den Kategorien der „Alcohol-Consumption“ in zwei Teildatensätze zu teilen. Ein Teildatensatz kann „None“ und „2 Pints“ enthalten. Die Kategorie „4 Pints“ sollte im zweiten Datensatz liegen. Denn im zweiten Profilplot oben sieht man, dass sich der Gender-Effekt in diesen beiden Teildatensätzen völlig unterschiedlich verhält (einmal male höher und einmal female höher). Und das genau ist die Interaktion, die den Haupteffekt stört.
Du untersuchst also dann den Haupteffekt von „Gender“ auf diesen beiden Teildatensätzen und wirst bei beiden ein völlig unterschiedliches Ergebnis erhalten, das Du auch entsprechend interpretieren solltest. Wenn Du vorher eine zweifaktorielle ANOVA gerechnet hast, verwendest Du hier in dem Beispiel dann zwei t-Tests als Signifikantests (wenn Du mehrere Kategorien vergleichst, sind es mehrere einfaktorielle ANOVAs)
In dem Beispiel wirst Du als Ergebnis erhalten, dass im ersten Datensatz (also bei „None“ und „2 Pints“) die Männer (signifikant) höhere Werte als die Frauen erreichen. Im zweiten Teildatensatz ist es umgekehrt: (signifikant) höhere Werte bei den Männern.
Das hier verwendete Beispiel ist entnommen aus Andy Field, Discovering Statistics Using SPSS, Sage, 2014: Googles.
Ich bin Statistik-Expertin aus Leidenschaft und bringe Dir auf leicht verständliche Weise und anwendungsorientiert die statistische Datenanalyse bei. Mit meinen praxisrelevanten Inhalten und hilfreichen Tipps wirst Du statistisch kompetenter und bringst Dein Projekt einen großen Schritt voran.
Kurze Frage wie die Ergebnisse berichtet werden: Angenommen ich bin sowohl an Haupteffekten als auch an Interaktionseffekten interessiert, da es sich um einen explorativen Ansatz handelt. Würde ich nicht global interpretierbare aber trotzdem signifikante HE berichten? Mit dem Hinweis, dass diese aufgrund der signifikanten Interaktion nicht interpretierbar sind? Oder „verschweigt“ man in einem solchen Fall den HE und berichtet nur die signifikante Interaktion? Vielen Dank schon mal im Voraus!
Hallo Fabian,
genau so kannst Du vorgehen: HE im Text nennen und (vorsichtig) interpretieren aber dazu den Hinweis geben, dass sie von einer signifikanten Interaktion gestört sind. Das passt.
LG Daniela
P.S: Interesse an mehr Austausch zur Statistik mit mir? Dann komm in die Statistik-Akademie: https://statistik-und-beratung.de/mitgliederbereich-lp/
Liebe Daniela,
kann es sein dass hier ein Irrtum vorliegt?
Dein Artikel widerspricht diesem Artikel, ich finde die Erklärung mit der „gleichen Richtung“ aber nachvollziehbarer als Kriterium für einen Haupteffekt als dass sich die Linien (ggf. nur minimal) kreuzen:
http://versuch.file2.wcms.tu-dresden.de/w/index.php/Semidisordinale_Interaktion
Viele Grüße
Alex
Hallo Alex,
das widerspricht sich nicht. In meinem Vorschlag wird nur in dem Bild jeweils der andere Haupteffekt interpretiert.
In dem Beispiel aus dem von Dir verlinkten Artikel würde ich im ersten Bild (Linien für „keine Hitze“ und „Hitze“) entscheiden, ob „Hitze“ als Haupteffekt interpretierbar ist. Und da sie sich kreuzen, sage ich: nicht interpretierbar. In dem Artikel wird über die Interpretierbarkeit des Haupteffekts der Hitze aber am zweiten Bild entschieden (Linien für „Frustration“, „keine Frustration“, Kategorien für Hitze). Man sieht, dass die Linie von „mit Frustration“ von der Kategorie „Hitze“ zu „keine Hitze“ abnimmt, die „keine Hitze“-Linie nimmt zu. Das entspricht genau dem Kreuzen der Linien im ersten Bild. Deshalb ist der Haupteffekt Hitze nicht interpretierbar. Du kannst es also so oder so herum machen. Ich finde die Betrachtung des Kreuzens einfacher. 🙂
LG Daniela
Liebe Daniela,
ergibt sich die (Nicht-)Interpretierbarkeit des Haupteffekts nicht schon daraus, dass er nicht signifikant wurde? Oder geht es nur darum eindeutig zu sagen dass man dann auch keine Trends mehr ableiten kann?
Liebe Grüße
Alex
Hallo Alex,
es kann sein, dass es einen Gruppenunterschied gibt, den man aber nur erkennt (signifikant), wenn man die Daten getrennt nach dem zweiten Faktor betrachtet. In so einem Fall kann es sein, dass dann der Haupteffekt nicht signifikant ist. Diese Nicht-Signifikanz liegt dann daran, dass der Haupteffekt von einer Interaktion gestört wird, und nicht daran, dass es keinen gibt.
LG Daniela