Die partielle Korrelation wird verwendet, wenn man den Zusammenhang zwischen zwei Variablen beschreiben will und dabei den Einfluss einer dritten Variable „heraus rechnen“ will. Man sagt dazu: „Man kontrolliert die dritte Variable“. Diese dritte Variable wird auch Kontrollvariable oder Störvariable genannt.
Das klingt sehr theoretisch. Wann aber braucht man die partielle Korrelation konkret? Das bekannteste Beispiel ist das von Störchen und Babys:
In einer Studie wurde für verschiedene Regionen untersucht, wie viele Störche dort zu Hause sind und wie hoch die Geburtenrate ist. Es zeigte sich eine signifikante positive Korrelation zwischen der Anzahl der Störche und der Anzahl der Babys. Das heißt, je mehr Störche eine Region hat, umso mehr Babys gibt es dort. Heißt das nun, dass der Storch die Babys bringt? Sicher nicht. Das ist ein typisches Beispiel, dass Korrelation keine Kausalität bedeutet.
Du willst mehr Durchblick im Statistik-Dschungel?
Berechnet man die partielle Korrelation des Vorkommens der Störche und der Geburtenrate und kontrolliert dabei die Variable Industrialisierung, so stellt man keine signifikante Korrelation mehr fest. Das zeigt, dass der eigentliche Zusammenhang zwischen der Industrialisierung und der Geburtenrate und zwischen der Industrialisierung und der Anzahl der Störche besteht und nicht zwischen der Anzahl der Babys und der Anzahl der Störche.
Die partielle Korrelation setzt lineare Zusammenhänge zwischen den Variablen sowie Normalverteilung der Residuen voraus. Für die normalverteilten Residuen reichen normalverteilte Variablen aus, was mit Normalverteilungsplots überprüft werden kann. Der lineare Zusammenhang wird mittels Streudiagrammen graphisch untersucht.
Ich bin Statistik-Expertin aus Leidenschaft und bringe Dir auf leicht verständliche Weise und anwendungsorientiert die statistische Datenanalyse bei. Mit meinen praxisrelevanten Inhalten und hilfreichen Tipps wirst Du statistisch kompetenter und bringst Dein Projekt einen großen Schritt voran.
Sehr geehrte Frau Keller,
im Zuge meiner Bachelorarbeit „Homogenitat von Kulturen im ländervergleich am Beispiel der Maskulinität soll ich ermitteln, ob die maskulinität (MAS) mit dem BIP pro Kopf korreliert.
Ich habe herrausgefunden, dass sie zu -,138 korrelieren und eine Signifikanz von ,015 vorliegt. Somit sind die beiden Variablen ja nicht miteinander signifikant.
Und auch die negative Korrelation ist sehr gering.
Was kann ich denn jetzt machen um vllt doch noch einen zusammenhang zwischen den beiden zu finden?
Könnte mir da eine Kontrollvariable weiterhelfen?
MfG Nils Müller
Hallo Herr Müller,
so wie Sie es schreiben, haben Sie eine schwache negative signifikante Korrelation, denn mit p=0,015 ist die Korrelation zum Signifikanzniveau von 5 % signifikant. Natürlich ist sie trotzdem sehr schwach, das stimmt. Eine Kontrollvariable könnte weiter helfen. Haben Sie denn eine Idee, welche Variable da mit hinein spielen könnte und können Sie diese messen?
Schöne Grüße
Daniela Keller
Das gibt’s auch? Jetzt bin ich überrascht. Beim „direkten Vergleich “ zeigt sich keine bzw. nur eine sehr schwache Korrelation zwischen X1 und X2, und durch „Herausrechnen“ des Einflusses einer Drittvariablen kann ein stärkerer Zusammenhang zwischen X1 und X2 festgestellt werden?
Ja, das gibt es auch.
Können Sie ein „alltagsnahes“ Beispiel nennen? Vielen Dank!
Mir fällt aktuell kein gutes Beispiel ein. Das kann aber immer dann vorkommen, wenn eine Variable durch eine andere „verfälscht“ oder „gestört“ wird. Meist rechnet man dann eine lineare Regression mit mehreren Faktoren, bei der dann der eine Faktor um den anderen korrigiert wird. Die partielle Korrelation macht etwas sehr ähnliches.
Liebe Frau Keller,
ich muss eine Kovarianzanalyse für nicht parametrische ordinal skalierte Daten erstellen und hab irgendwie keine Ahnung wie ich dies anstellen soll. Ich habe es über eine ordinale Regression versucht, ist das korrekt? Wenn ja, wie interpretiert man dabei die Ausgabe? Ich gebe zuerst die Variable, die die Gruppenaufteilung festlegt als fixe Variable an und anschließend den BDI (als Beispiel) als abhängige Variable, wenn die Hypothese (BDI ist in den verschiedenen Gruppen unterschiedlich bestätigt wurde) Was bedeutet es, wenn ich dabei beim parallel Test für Linien ein signifikantes Ergebnis bekomme? Für eine mir sehr wichtige Variable bekomme ich dabei gar keine Ausgabe, nur die Meldung
„Der Wert der Log-Wahrscheinlichkeit des allgemeinen Modells liegt unter dem des Null-Modells. Dies liegt daran, daß die Konvergenz beim Schätzen des allgemeinen Modells nicht ereicht oder festgelegt werden kann. Daher kann der Test der parallelen Linien nicht ausgeführt werden“
Ich würde mich sehr freuen, wenn Sie mir helfen könnten, vor allem weil ich langsam verzweifle.
Beste Grüße
Sarah
Hallo Sarah,
die ANCOVA für ordinale Daten über die ordinale Regression zu berechnen habe ich noch nie gemacht. Ich würde dafür eine robuste ANCOVA in R verwenden (gibts nicht in SPSS). Aber vielleicht brauchst du das gar nicht. Wie wurden die ordinalen Daten erhoben? Hast du sie mal auf Normalverteilung überprüft? Wie groß ist deine Stichprobe? Vielleicht sind die Voraussetzungen für die „normale“ ANCOVA gar nicht so stark verletzt und du kannst sie trotzdem rechnen.
Schöne Grüße
Daniela
Vielen Dank für die schnelle Antwort Frau Keller.
Ich habe eine Gruppe mit 49 Teilnehmern (Abhängigkeit) wovon ich zwei Untergruppen bildete (23(legale Drogen)und 26(illegale Drogen)). Zudem eine Kontrollgruppe mit 171Teilnehmern. Ja leider habe ich keine Normalverteilung, dies habe ich überprüft. Aber ich könnte, da ich „fast“ 30 Teilnehmer pro Gruppe habe auch davon ausgehen? Die ordinalen Daten wurden anhand mehrerer Items mit Likert Skala erhoben (Selbstwert, Selbstwirksamkeit, usw.. ). Für jeden Teilnehmer wurde pro Konstrukt der Median ermittelt, mit welchen ich die Gruppen verglich. Ich würde einfach die parametrische ANCOVA rechnen und angeben, dass die Ergebnisse nur eine eingeschränkte Validität haben?
Liebe Grüße
Sarah
Hallo Sarah,
ja, du könntest aufgrund der Gruppengröße sagen, dass die Methode robust auf die Verletzung der Normalverteilung reagiert. Die ANCOVA hat aber noch weitere Voraussetzungen, hast du die überprüft? Warum rechnest du eigentlich eine ANCOVA, was ist die Kovariate? Für weitere Diskussionen kannst du gern der Facebook-Gruppe Statistikfragen https://www.facebook.com/groups/785900308158525/ beitreten!
Schöne Grüße
Daniela
Hallo Daniela,
ich hätte mal eine Frage zur partiellen Korrelation. Gibt es nicht fast immer eine dritte Variable, die auf die Korrelation einen Einfluss hat? Irgendetwas könnte man doch immer finden (wenn auch nicht als Daten erhoben), sodass die einfache Korrelation doch nie wirklich viel Aufschluss gibt. Oder sehe ich das zu streng?
Beste Grüße
Stefan
Hallo Stefan,
ja, das stimmt. Es gibt immer Störfaktoren, und wenn es nur zufällige Messfehler sind. Insofern kann eine schwach Korrelation auch bedeuten, dass es zu viele Störfaktoren gibt, die den tatsächlichen Zusammenhang verschleiern, ja.
Schöne Grüße
Daniela
Hallo Daniela,
ich würde für meine Masterarbeit gerne den Zusammenhang von Narzissmus und Leistungsoutcomes berechnen. Grundsätzlich würde ich hier eine Regression rechnen. Allerdings wünscht sich meine Betreuerin die Kontrolle der möglichen Einflussvariablen Geschlecht und Altern. Das geht doch dann nur über eine partielle Korrelation, oder?
Vielen Dank bereits für das Feedback!
Regina
Hallo Regina,
nein, Du kannst eine multiple lineare Regression rechnen, in der Du Geschlecht und Alter mit als Faktoren aufnimmst und somit dafür korrigierst.
LG
Daniela
Hallo,
ich würde gerne den Zusammenhang zweier Variablen unter Kontrolle einer dritten prüfen. Die beiden Variablen, für die ich einen Zusammenhang annehme erfüllen die Voraussetzungen für die Pearson Korrelation und daher auch für die Partialkorrelation. Bei der Kontrollvariable bin ich unsicher. Muss diese auch die Voraussetzungen erfüllen? Bei ihr gibt es einen Ausreißer und ich weiß gerade nicht, wie ich die Linearität prüfen sollte, bzw. ob man es überhaupt notwendig ist, da ich ja keinen Zusammenhang mit dieser Variable herausfinden will, sondern diese Variable konstant halten will, um den Zusammenhang zweier anderer Variablen, kontrolliert um diese Variable berechnen will.
Vielen Dank für Ihre Hilfe!
LG Anica
Hallo Anica,
streng genommen müssten die Residuen der partiellen Korrelation normalverteilt sein. Aber an die kommst Du eventuell nicht ran. Wenn die dritte Variable annähernd normalverteilt ist und mit den beiden anderen jeweils in einem einigermaßen linearen Zusammenhang steht (nicht nicht-linear), dann passt das.
Zur Sicherheit könntest Du Dich mit Bootstrapping absichern.
Wenn Du Dich weiter mit mir zu Deinen Statistikfragen austauschen willst und meine umfangreiche Bibliothek mit vielen Videos und Anleitungen zu Statistikthemen nutzen willst, dann komm in die Statistik-Akademie: https://statistik-und-beratung.de/mitgliederbereich-lp/
LG Daniela
Hallo Daniela,
im Rahmen meiner Bachelorarbeit möchte ich einen Zusammenhang zwischen 2 Variablen unter Kontrolle der dritten Varianlen berechnen. Das Problem ist aber, dass meine Kontrollvariablen nicht intervallskaliert sind. Ich habe z.B. Geschlecht, Bildungsniveau, Gesundheitszustand. Sie sind alle etweder nomila oder ordinal. Kann ich trotzdem partielle Korrelation anwenden? oder gibt es dabei Altenativen? Danke für Ihre Antwort im Voraus!
LG Zarina
Hallo Zarina,
mit dichotomen Variablen kannst du die partielle Korrelation verwenden.
Wenn Du bei Deinen beiden Dich interessierenden Variablen außerdem festlegen kannst, wer unabhängige und wer abhängige Variable sein soll, dann wäre wohl die lineare Korrelation passend. Da siehst Du dann den Effekt der unabhängigen Variable auf die abhängige Variable kontrolliert für alle anderen Variablen im Modell und kannst als Kontrollvariablen auch nominale und ordinale aufnehmen. Allerdings musst Du darauf achten, dass Du die Voraussetzungen erfüllt hast.
Alternativ kannst Du eventuell bei manchen ordinalen Variablen argumentieren, dass Du sie auch wie metrisch verwenden kannst und dann trotzdem die partielle Korrelation rechnen? Das musst Du aber gut begründen!
LG Daniela
P.S.: Wenn Du schnelle Antworten auf all Deine Statistikfragen bekommen möchtest und Zugriff auf meine Videotutorials, Erklärvideos usw., dann komm doch in die Statistik-Akademie: https://statistik-und-beratung.de/mitgliederbereich-lp/
Hallo Daniela,
Ich habe recherchiert wie wild doch leider finde ich nirgends, wie man eine partielle Korrelation nach APA berichtet?
Lieben Gruß
Hallo Vanessa,
ich habe auch keine Literaturquelle dazu. Aber ich würde sie wie die Korrelation berichten und zusätzlich angeben, für welche Variable(n) kontrolliert wurde. Manchmal wird das auch mit tiefgestellten Buchstaben markiert (r_x). Je nachdem, wie klar das dem Leser dann wird, kannst Du diese Abkürzung nehmen. Im Zweifel formulierst Du aber aus, dass kontrolliert wurde und für welche Variablen.
LG Daniela
P.S.: Wenn Du regelmäßig Deine Fragen an mich loswerden willst und viele ausführliche Infos, Videos, Tutorials und Lernmaterial für Deine Datenanalyse suchst, dann komm in die Statistik-Akademie: https://statistik-und-beratung.de/mitgliederbereich-lp/
Hallo,
ich stehe gerade etwas auf dem Schlauch. Ich habe in meinem Fragebogen ein Treatment eingebaut und will dessen Effekt auf meine abhängigen Variablen untersuchen. Dabei will ich dann auch politische Einstellungen bzw. Umweltbewusstsein miteinbeziehen. Ist das nun eine Moderation oder sollte ich eine partielle Korrelation rechnen? Oder vielleicht etwas ganz anderes?
LG
Hallo Philippe,
welche Methode da passt kommt darauf an, welches Messniveau Deine abhängige Variable hat. Ich denke, eine partielle Korrelation wird es nicht werden, weil Du ja eine Gruppenvariable (Treatment ja/nein) dabei hast.
LG Daniela
P.S.: Wenn Du mehr zur Statistik von mir lernen willst, dann schau Dir mein Angebot der Statistik-Akademie an: https://statistik-und-beratung.de/mitgliederbereich-lp/
Hallo, müssen als Voraussetzung für die partielle Korrelation die jeweiligen Variablenpaare x und y sowie x und z ( Kontrollvariable) und y und z einen linearen Zusammenhang aufweisen. Und welche Vorraussetzungen hat die Spearman Korrelation, hierbei dürfen doch Ausreiser in den Variablen vorliegen und die Variablen müssen auch nicht normalverteilt sein, aber wie sieht es mit dem linearen Zusammenhang aus muss der wenigstens vorliegen um die Korrelation nach Spearman berechnen zu dürfen.
Würde mich über eine Antwort freuen
Hallo Nani,
die Korrelation nach Spearman braucht keine Linearität.
Übrigens habe ich gerade auf YouTube ein Video veröffentlicht, wo ich erkläre, wie man die nicht-paramterische partielle Rangkorrelation mit einem Trick über die Syntax in SPSS rechnen kann. Hier der Link: https://www.youtube.com/watch?v=PanvsHhDknE&t=100s
LG Daniela
P.S: Wenn Du regelmäßig Antworten auf Deine Statistikfragen und Zugang zu einer Menge super aufbereitetem Statistikmaterial haben möchtest, dann komm in die Statistik-Akademie: https://statistik-und-beratung.de/mitgliederbereich-lp/
Hallo Frau Keller,
ich muss eine Hausarbeit über die Partielle Korrelation schreiben und habe sowohl in ihrem Artikel, als auch in meinem Lehrbuch gelesen, dass die Normalverteilung eine Voraussetzung für die Untersuchung auf Partielle Korrelation darstellt. Jedoch ist keine der SPSS Datendateien, die mir zur Verfügung stehen normalverteilt. Ich konnte leider nirgendwo finden, welche Auswirkung das auf meine Ergebnisse hat. Ich habe einen ganzen Absatz als Einführung der Untersuchung auf Normalverteilung gewidmet, bin auf das Ergebnis gekommen, dass die Erhebungsmerkmale nicht normalverteilt sind, weiß aber nicht was ich nun als Schlussfolgerung daraus ziehen soll.
Ich würde mich sehr über eine Antwort freuen
Liebe Grüße,
Nils
Hallo Nils,
wir können uns gern duzen.
Hier in dem Video zeige ich Dir, wie Du die nicht-parametrische partielle Korrelation in SPSS über einen Trick machen kannst: https://www.youtube.com/watch?v=PanvsHhDknE
LG Daniela
Das erkennt man auch deutlich an den Corona-Statistiken.