Was meinen Statistiker, wenn sie von verbundenen Stichproben sprechen?
Verbundene Stichproben sind Daten, die an den gleichen Fällen/Patienten gemessen wurden.
Wenn zum Beispiel ein Laborparameter an allen Patienten vor und nach der Behandlung gemessen wird, dann hat man zwei Stichproben:
- eine mit Messungen vor der Behandlung und
- eine mit Messungen nach der Behandlung.
Diese beiden Stichproben sind verbunden, da jede Stichprobe von jedem Patienten einen Messwert enthält. Das gleich gilt, wenn man einen Zeitverlauf mit mehr als zwei Messzeitpunkten beobachtet und zu jedem Messzeitpunkt jeden Patienten misst. Dann hat man mehr als zwei Stichproben, die alle verbunden sind.
Verbundene Messungen entstehen nicht immer nur bei einer Betrachtung zu verschiedenen Zeitpunkten. Es ist auch möglich ohne Betrachtung über die Zeit verbundene Messungen zu haben. Zum Beispiel bei Verwendung von zwei Bedingungen am gleichen Untersuchungsobjekt: Jeder Proband macht den Test einmal unter Bedingung A und einmal unter Bedingung B. Dann sind auch das verbundene Messungen.
Statt verbundene Stichproben wird oft auch der Ausdruck gepaarte Stichproben oder abhängige Stichproben verwendet.
Unverbunden oder ungepaart oder unabhängig sind Stichproben, wenn sie an komplett unterschiedlichen Untersuchungsobjekten (z.B. Patienten) gemessen wurden. Also zum Beispiel, wenn der Laborparameter an Frauen und Männern gemessen wird. Man hat dann wieder zwei Stichproben: Die Frauen und die Männer. Diesmal sind sie unverbunden oder ungepaart, da die Patienten genau einer Gruppe zugeordnet werden.
Für die Auswahl der richtigen statistischen Methoden müssen Sie sich klar machen, ob Sie unverbundene oder verbundene Stichproben haben.
Allerdings verlangen alle Methoden, ob für unverbundene oder für verbundene Stichproben, dass die Messungen INNERHALB der Stichproben, unabhängig sind. Das heißt, dass in den Stichproben keine Mehrfachmessungen vorkommen dürfen. Es darf also jeder Patient für jede Stichprobe nur einmal gemessen werden.
Ich bin Statistik-Expertin aus Leidenschaft und bringe Dir auf leicht verständliche Weise und anwendungsorientiert die statistische Datenanalyse bei. Mit meinen praxisrelevanten Inhalten und hilfreichen Tipps wirst Du statistisch kompetenter und bringst Dein Projekt einen großen Schritt voran.
Hallo, ich habe eine Frage zu Verbundenheit oder Unverbundenheit einer Stichprobe.
Angenommen, ich habe die monatlichen Umsätze für die Jahre 2011 und 2012. Jetzt möchte ich vergleichen, ob die der durchschnittliche monatliche Umsatz sich von 2011 zu 2012 verändert hat. Handelt sich bei meinem monatlichen Umsätzen um verbundene Stichproben, da ich ja beispielsweise Jan ’11 und Jan ’12 (und Feb ’11 und Feb ’12 etc.) habe?
Viele Grüße
Mohamed
Hallo Mohamed,
ja, das sind verbundene Stichproben. Man könnte sich auch vorstellen, für jeden Monat die Veränderung als eine Differenz zum Vorjahr zu berechnen. Das enstpricht genau der Idee der verbundenen Stichproben.
Schöne Grüße
Daniela
Hallo Daniela
Vielen Dank für die schnelle und einleuchtende Erklärung.
Viele Grüße
Mohamed
Hallo, vielen Dank für diese kurze und doch deutliche Erklärung. Eine Frage bleibt mir aber, bei der mir ein andere Beitrag mit dem Beispiel jedoch nicht geholfen hat. (https://statistik-und-beratung.de/2014/10/was-tun-bei-teilweise-verbundenen-daten/#more-1063)
Wie würde es aussehen wenn ich z.B. bei fünf Patienten den Kniesehnenreflex testen möchte. Dabei geht es mir darum herauszufinden ob ich eine stärkere Auslenkung, in Grad gemessen, erreiche wenn ich einen blanken Stahlhammer oder ein zartes Gummihämmerchen verwende. Dabei Klopfe ich jedem Patienten mit jedem Hammer insgesamt dreimal auf das Knie. Fünf Patienten, zwei Hämmer und jeweils drei Messungen. Stahlhammer und Gummihammer bei den gleichen Patienten sind verbundene Messwerte, aber wie handhabe ich nun die Messwiederholungen? Wird aus diesen ein Mittelwert gebildet und dann die Mittelwerte zwischen den Patienten/Hämmern verglichen oder muss ich etwas ganz anderes machen?
Schönen Gruß
Philipp
Hallo Philipp,
die Messwiederholungen werden in dem Fall als Mittelwert zusammen gefasst. Hintergrund ist der, dass man durch die dreimalige Durchführung und dann Mittelwertbildung einen verlässlicheren Messwert bekommt.
Schöne Grüße
Daniela
Hallo Daniela,
vielen Dank, ich dachte schon, dass da noch ganz besonderes statistisches Hexenwerk passiert. So ist es natürlich schöner :o)
Besten Dank nochmal für die Aufklärung.
Philipp
Hallo Daniela,
eine kurze Frage zu verbundenen bzw. nicht-verbundenen Stichproben. Ist meine Stichprobe verbunden, wenn ich z.B. ein Unternehmen habe und dessen Kennzahlen in einem Jahr bezüglich der Einhaltung eines Gesetztes untersuche. (1 Variable) dieses Gesetzt sich dann ändert und ich die Kennzahlen in einem anderen Jahr erneut untersuche aber der Sollmaßstab dann die Einhaltung des neuen Gesetzes ist? (2. Variable)
Vielen Dank im Voraus!
M.
Hallo,
ja, das ist verbunden.
Schöne Grüße
Daniela Keller
Hallo Daniela,
wenn ich die gleiche Messung von Winkeln am linken und am rechten Bein des gleichen Patienten messe, handelt es sich dann auch um verbundene Stichproben?
Ja, das sind verbundene Stichproben.
Schöne Grüße
Daniela Keller
Hallo Daniela,
wenn ich verschiedene Antworten einer einmaligen Umfrage EINER Person miteinander vergleichen bzw. auswerten möchte, dann sind die Antworten gepaart, richtig?
Vielen Dank!
MFG Isabel
Ja, die sind gepaart.
Schöne Grüße
Daniela Keller
Hallo Daniela,
wenn ich Teilnehmer an einer Veranstaltung, die 2009 und 2010 stattfand, vergleiche (zB bezüglich ihrer Körpergrösse), ist dies verbunden? Nicht viele der Personen, die 2009 teilnahmen, nahmen auch 2010 teil.
LG
Hallo Anna,
die Daten der Personen, die an beiden Veranstaltungen dabei waren, sind verbunden. Die Daten der anderen, die nur 2009 oder nur 2010 waren, sind unverbunden. Für die Analyse mit Tests können aber nur entweder verbundene oder unverbundene verwendet werden, nicht gemischt.
Schöne Grüße
Daniela Keller
Hallo aufgrund einer längeren Diskussion bin ich auf diese Seite und gestoßen und wäre sehr dankbar über eine Antwort,
Wir untersuchen, ob Erstgeborene im Durchschnitt kleiner sind als ihre jüngeren Geschwister.
Dazu messen wir bei 17 Familien, die alle mindestens zwei Kinder haben, die Größe des ältesten und
des zweitältesten Kindes im Alter von 10 Jahren. Wir vergleichen die Größen der Kinder.
Da die Messungen nicht am selben Objekt durchgeführt werden ist dies doch eine ungepaarte Stichprobe, oder? Vielen Dank im Voraus
Hallo,
Sie haben hier gepaarte Stichproben. Sie können es sich auch so vorstellen: das untersuchte Objekt ist die Familie, von der wird das erste und das zweite Kind jeweils mit 10 Jahren gemessen. Das sind zwei Messungen am gleichen Objekt (Familie). Deshalb gepaart.
Schöne Grüße
Daniela Keller
Guten Tag Frau Keller
Ich habe ein Design mit einem vierstufigen Gruppenfaktor (=4 Bedingungen) und drei Messzeitpunkten (prä, post und follow-up). Zur Untersuchung des kurzfristigen Effekts habe in einem ersten Schritt eine einfaktorielle ANOVA mit der UV „Gruppe“ und der AV „change score 1“ (Differenz „post – prä“) gerechnet. Mit welchem Test bringe ich nun in einem zweiten Schritt zur Untersuchung der Effektstabilität den „change score 1“ (post – prä) mit dem „change score 2 “ (follow-up – post) in Verbindung? Oder wäre es besser, von Anfang an den change score 2 in die Analyse miteinzubeziehen und folglich eine einfaktorielle ANOVA mit Messwiederholung zu rechnen?
Besten Dank für Ihre Antwort.
Viele Grüsse
Finn
Hallo,
was genau meinen Sie mit „Effektstabilität“ und „in Verbindung bringen“? Möchten Sie sehen, dass es im zweiten Schritt auch einen Gruppenunterschied gibt? Oder möchten Sie sehen, ob die Veränderung Post-Prä mit der Veränderung FollowUp-Post zusammenhängt?
Schöne Grüße
Daniela Keller
Hallo Daniela, eigentlich dachte ich, ich hätte das Prinzip verstanden. Nun bin ich aber doch wieder ein wenig durcheinander. Deshalb frage ich lieber noch einmal nach. Ich habe eine Verum- und eine Placebogruppe und beobachte die Gruppen über 12 Monate und nehme drei Mal Blut. Wenn ich jetzt schauen möchte, ob es zu einer Veränderung der Blutkonzentration in der Verum bzw. der Placebogruppe gekommen ist, verwende ich einen verbundenen Test oder? Und wenn ich jetzt die beiden Gruppen über den Zeitverlauf miteinander vergleichen möchte, verwende ich einen ungepaarten Test oder? Vielen Dank im Voraus, dein Blog ist wirklich sehr hilfreich! Viele Grüße
Hallo,
wenn jeder Zeitpunkt einzeln betrachtet wird und da jeweils Verum mit Placebo verglichen wird, ist das ein ungepaarter Test. Wenn der Zeitverlauf einer Gruppe (entweder Placebo oder Verum) betrachtet wird (Gibt es eine Veränderung über die Zeit?) ist das ein verbundener Test. Wenn gleichzeitig ein Gruppenunterschied und ein Unterschied in der Zeit untersucht werden soll und auch, ob die beiden Gruppen sich über die Zeit unterschiedlich verändern, dann ist das eine 2faktorielle Varianzanalyse (ein Gruppenfaktor und ein Zeitfaktor).
Schöne Grüße
Daniela Keller
Hallo Daniela,
angenommen ich habe einen Datensatz der mit Hilfe von zwei verschiedenen Methoden ausgewertet wird und deren Ergebnisse dann verglichen werden sollen, sind das verbundene Stichproben?
Liebe Grüße,
Melanie
Hallo Melanie,
wenn die beiden Messungen am gleichen Objekt vorgenommen werden, dann sind das verbundene Stichproben.
Tritt doch unserer neu gegründeten Facebook-Gruppe Statistikfragen bei: https://www.facebook.com/groups/785900308158525/
Dort kannst du weitere Fragen stellen und mit mir und den anderen Teilnehmern darüber diskutieren.
Schöne Grüße
Daniela
Vielen lieben Dank für deine schnelle Antwort.
Hallo Daniela,
wir haben mittels einer schriftlichen Befragung (Fragebogen mit verschiedenen Fragestellungen z.B.: Erziehungssituation, Geschlecht, …) 900 Eltern von Zweitklässlern aus einer Stadt befragt.
Nun wollen wir mit SPSS verschiedene Auswertungen vornehmen und sind jetzt völlig durcheinander:
– abhängige oder unabhängige Stichprobe
– eine, zwei oder mehrere Stichproben
– unabhängiges Studiendesign
… Vielleicht kannst du mit einem klaren Blick auf die Dinge eine Antwort geben.
Vielen Dank!!
Viele Grüße
Juliane
Hallo Juliane,
seht euch doch mein kostenloses E-Book an, das gibt es hier auf meiner Seite zum kostenlosen Download. Das gibt einen ersten Überblick. Zudem könnt ihr gern eure Fragen in der Facebook-Gruppe Statistikfragen diskutieren: https://www.facebook.com/groups/785900308158525/. Wenn das nicht reicht, kann ich euch auch mit einer individuellen Beratung unterstützen. Dann bitte einfach eine Email schreiben und wir klären alles weitere.
Gruß
Daniela
Hallo Daniela,
mittels Fragebogen ermittle ich vor und nach einer Intervention die Ausprägung verschiedener interessierender Merkmale bei der gleichen Stichprobe. Ich habe also gebundene Stichproben vorliegen. Nun habe ich eine Kontrollgruppe diesen Fragebogen zu den gleichen Zeitpunkten ausfüllen lassen. Die Kontrollgruppe hat somit nicht an der Intervention teilgenommen, entstammen aber der gleichen „Grundgesamtheit“ (alle am gleichen Arbeitsplatz, gleiche Umgebung).
Wie gehe ich mit den vier Datensätzen um? bislang habe ich die Daten je nach Skalen-Niveaus (t-Test, Chi-Quadrat) nur innerhalb der IG und innerhalb der KG vergleichen. Wie prüfe ich den Unterschied dieser beiden Gruppen?
Ich habe schon recht einen Wurm im Kopf und verstehe nur noch Bahnhof. Kannst du mir helfen???
Ich danke dir für deine Rückmeldung.
Liebe Grüsse,
Kathrin
Hallo Kathrin,
wenn du die beiden Gruppen vergleichst, hast du unverbundene Stichproben. Dann verwendest du die passenden Methoden dazu (z.B. t-Test für unverbundene Stichproben oder Mann-Whitney U Test). In meinem E-Book findest du eine Übersicht dazu. Wenn es dir um den Unterschied vorher/nachher geht, kannst du genau diesen Unterschied durch Differenzen berechnen und dann diese Differenzenvariable analysieren, z.B. wieder mit Gruppenvergleich.
Schöne Grüße
Daniela
Hallo Daniela,
wie verhält es sich mit dem Thema unverbundene oder verbundene Stichproben, wenn ich das Material eines Spenders halbiere und die eine Hälfte mit einer Methode, die eine Substanz A enthält behandle und die zweite Hälfte des gleichen Spenders mit der gleichen Methode, jedoch ohne diese Substanz A behandle. Getestet wird dann die Materialeigenschaft um ggf. Rückschlüsse auf den Einfluss dieser Substanz darauf zu überprüfen. Sind die zwei Stichproben dann verbunden? Vielen Dank für die Antwort im Voraus.
Gruß Conny
Ja, das sind verbundene Stichproben.
Hallo Daniela,
ich unterteile eine Lungenprobe eines Patienten in kleinere Stücke und behandle diese mit verschiedenen Erregern. Das mache ich mit etwa 6 Lungenproben von 6 verschiedenen Patienten. Wenn dann die Wirkung der unterschiedlichen Erreger untereinander verglichen werden soll (zusammengefasst in allen 6 Patienten), bin ich mir nicht sicher ob es sich um verbundene oder unverbundene Gruppen handelt. Irgendwie macht das bei uns jeder anders, blick da schon gar nicht mehr richtig durch.
Vielen Dank im Voraus. Viele Grüße,
Johanna
Hallo Johanna, das sind verbundene Stichproben. Gruß Daniela
Hallo Daniela,
danke dir für deine Hilfe. Dein e-book hat mir gerade auch durch die tolle Übersichtsgrafik geholfen. Die Anwendungsbeispiele für die einzelnen Auswertungsverfahren sind auch top 🙂
Nun komme ich an einen Punkt, wo ich sehr spezifisch sein muss. Und zwar muss ich nominalskalierte Daten auswerten, die recht komplex sind. Teilweise habe ich bis zu 7 Antwortmöglichkeiten für eine nominalskalierte Frage. Ich habe immer noch zwei Gruppen (Interventions- und Kontrollgruppe) und möchte einen Gruppenvergleich machen. Ich muss dafür ja immer noch den Chi-Quadrat-Test machen, weiss aber nicht, wie ich den erwarteten Wert ermittle. Es ist ein Vorher-Nachher-Test (Fragebogen vor und nach Intervention). Muss ich zunächst das Delta doch mit arithm. Mittel errechnen zwischen den beiden Gruppen, um dann mit Chi fortfahren zu können? Ich muss gestehen, dass ich bislang alles (z.b. Intervall-Daten mittels t-test) selbst mit Excel gerechnet habe. Chi ist nun so komplex, dass ich ohne Statistikprogramm an die Grenzen komme. Aber ich denke, wenn ich weiss, wie ich aus den beiden Gruppen den erwarteten Wert ermitteln kann, komme ich auch mit den Ergebnissen weiter. Kannst du mir eine Hilfestellung geben?
Danke dir 1000 Mal für deine Hilfe. Wenn du denkst, es ist zu komplex, um das einfach so in ein paar Sätzen klären zu können, hast du Kapazitäten im Rahmen einer tiefergehenden, natürlich bezahlten Beratung?
Lieber Gruss,
Kathrin
Hallo Kathrin, das freut mich, dass dir das E-Book schon so gut geholfen hat und so gut gefällt! 🙂
Meinst du mit „erwarteten Wert“ die erwartete Zellhäufigkeit in der Kreuztabelle? Falls ja: hier findest du eine schöne anschauliche Erklärung, wie du auf diese Werte kommst: http://www.mesosworld.ch/lerninhalte/Biv_Chi/de/html/unit_BeobHaeuf.html
Es gibt übrigens auch Online-Rechner, die den Chi-Quadrat-Test machen.
LG
Daniela
Hallo Daniela,
wenn ich Daten hinsichtlich einer Variable (health) für jede Versuchsperson als Selbstbericht und auch als Fremdbericht habe und diese beiden Berichte miteinander vergleichen möchte, habe ich dann auch gepaarte Stichproben, weil sich die Angaben immer auf eine Versuchsperson beziehen?
Danke für deine Hilfe!
Liebe Grüße,
Hannah
Hallo Hannah,
ja, das ist gepaart.
Schöne Grüße
Daniela
Hallo Daniela,
ich habe für eine Untersuchung von Rufbereitschaft Blutdruckdaten von einer Stichprobe erhoben. Und zwar einmal an einem Tag mit Rufbereitschaft und an einem Tag ohne. Diese will ich jetzt miteinander vergleichen.
Sind es dann verbundene oder unverbundene Stichproben?
Und wie wäre das wenn ich z.B. die Kontrollgruppe mit der Rufbereitschaftsgruppe vergleichen möchte?
Vielen Dank für deine Antwort!1
Hallo Caroline,
wenn du an einer Person immer zweimal misst (mit und ohne Rufbereitschaft), sind das verbundene Stichproben. Wenn du eine Gruppe mit Rufbereitschaft und eine ohne (Kontrolle) hast, sind das unverbundene Gruppen.
Schöne Grüße
Daniela
Sehr geehrte Frau Keller,
ich studiere Pflegewissenschaft/Management und lerne auf eine Prüfung.
Könnten Sie mir bitte in einfachen Worten folgende Begriffe erklären:
a) Chi-Quadrat Test
b) Wilcoxon-Vorzeichen-Rang Test
c) T-Test
d) gepaarte Tests
e) Effektstärke
r) Korrelationsstatistik
Vielen Dank,
mit freundlichen Grüßen,
Kathrin Pittracher
Liebe Kathrin,
da kann ich dir Wikipedia oder meine Statistik-Fragen Gruppe auf Facebook empfehlen: https://www.facebook.com/groups/785900308158525/
Schöne Grüße
Daniela
Hallo Daniela,
ich untersuche verschiedene Messpunkte bzw. Proben ( Fluss,Grundwasser, Pflanzen und Böden) nach 2 Parametern ( Häufigkeit zweier Stoffe) und diese Punkte wurden mehrfach an den jeweiligen Stellen erprobt (wöchentlich, teils nur monatlich).
In SPSS möchte ich nun Vergleiche zwischen 3 Proben (Bsp. Fluss,Pflanze,Boden) darstellen. Meine Proben sind verbundenen oder?
Wenn ja verwende ich dann Friedmann Test oder ANOVA mit Messwiederholungen je nach Normalverteilung an.
Vielen Dank für die Hilfe, denn ich habe nun alle meine Vergleiche nach Kurskall-Wollis (keine normal Verteilung) oder ANOVA / Welch-Test (je nach Varianzhomogenität) berechnet und bin mir jetzt nicht sicher ob die Proben doch verbunden sind.
liebe Grüße,
Thorsten
Hallo Thorsten,
die Messungen sind an bestimmten gleichen Messpunkten erhoben? Also ist ein Messwert von Fluss, einer von Pflanze, einer von Boden jeweils einem bestimmten Messpunkt zuzuordnen? Dann sind sie verbunden. Und die vorgeschlagenen Methoden passen dann.
Schöne Grüße
Daniela
Hallo Daniela,
Ja die Messpunkte sind gleich. Also habe ich z.B. 4 mal an der selben Stelle Grundwasser erhoben und 4 mal am selben Messpunkt Bodenproben entnommen. Allerdings sind die Messwiederholungen nur wichtig, um ein Durchschnittswert für die Punkte zu bekommen und so mögliche Messfehler/Abweichungen zu relativieren. Es soll kein Vergleich zwischen den Messtagen stattfinden, wie es bei medizinischen Studien der Fall ist (vor und nach der Medikation ). Könnte ich daher vielleicht nicht doch bei den unverbundenen Test bleiben.
Vielen Dank und schöne Grüße,
Thorsten
Ps. Super Seite
Hallo Thorsten,
gut, aus den Messwiederholungen pro Erhebungsart (Wasser, Boden) bildest du einen (Mittel-)Wert für die weitere Analyse. Das passt. Da du aber ja an der gleichen Stelle die verschiedenen Arten von Proben nimmst (Wasser, Boden, Pflanze), sind diese dann doch immernoch verbunden und werden mit einer verbundenen Methode ausgewertet.
Schöne Grüße
Daniela
Hallo Daniela,
eine super Seite die du hier hast!!
Ich hänge hier an was fest. Und zwar lautet das Beispiel so: die Messungen des Durchmessers an einem Zapfen mit zwei Bügelmessschrauben ergab folgende Werte: …
Es sind zwei Messreihen mit jeweils 24 Messungen. Ich soll überprüfen: ob beide Messreihen aus derselben Grundgesamtheit kommen und den richtigen t-Test auswählen.
Für mich ist das ein gepaarter t-Test, bedingt durch den Ablauf der Messungen. Nachdem ich mir jetzt die Ergebnisse anschaue (für t habe ich 5,0483 ausgerechnet), und dieses mit den t-krit Werten vergleiche, komme ich zu dem Entschluß die Nullhypothese zu verwerfen. Desweiteren stammen dann die Messreihen nicht aus der gleichen Grundgesamtheit. Kann das sein?
Liebe Grüße
Lukas K.
Hallo Lukas,
ob die Messreihen verbunden sind oder nicht, ist mir gerade nicht ganz klar. Es geht um zwei Bügelmesschrauben. An jeder werden mehrere Messungen durchgeführt. Wie genau kann ich mir die Messungen vorstellen? An bestimmten Stellen? Mehrmals an der gleichen Stelle???
Ja, der Test verwirft die Nullhypothese und damit stammen die Messreihen nicht aus der gleichen Grundgesamtheit. Anders formuliert: Die Messreihen unterscheiden sich signifikant. Ja, das kann sein 🙂
Schöne Grüße
Daniela
Liebe Frau Keller,
ich habe eine Stichprobe an Personen mit zwei unterschiedlichen Wahrnehmungstests getestet, die die gleiche Fragestellung untersuchen. Jede Person hat beide Tests durchgeführt und ich möchte herausfinden, ob sich die Art des Tests auf verschiedene Messgrößen auswirkt.
Handelt es sich hierbei nun um gepaarte oder ungepaarte Stichproben? Ich bin mir nicht sicher, da die Personen ja die gleichen sind, aber die Tests jeweils unterschiedlich.
Viele Grüße
Marisa
Hallo Marisa,
das ist gepaart.
Schöne Grüße
Daniela
Guten Morgen Frau Keller.
Für meine Bachelorarbeit habe ich die Mittelwerte einiger Items, jeweils einen Block zur Führungskultur, Mitarbeiterkultur und Lern- und Gesundheitskultur zwischen den Mitarbeiterbefragungen, die 2009 und 2013 im Rahmen unseres Unternehmens durchgeführt wurden, verglichen. Dazu habe ich den t-Test für unabhängige Stichproben berechnet und ebenso die Effektstärken r. Mein Prof hat mir nun nahe gelegt, dass ich für meinen Anhang zudem ein Punktwolkendiagramm für wichtige Korrelationen zwischen den Itemblöcken erstellen sollte. Jetzt steh ich allerdings auf dem Schlauch. Auf meine Nachfrage antwortete er mir lediglich: „…die Faktoren der interkulturellen Korrelationen können sie doch selbst bestimmen, die, die sie für wichtig erachten.“
Da ich im Rahmen des Studiums keine statistische Ausbildung genossen habe, frage ich mich, welche Korrelationen überhaupt Sinn machen und mit welchem Verfahren ich diese erstellen kann. Ich hoffe Sie können mir einen hilfreichen Tipp dazu geben?!
Viele Dank im Voraus.
Jasmin
Hallo Jasmin,
wie sehen deine Daten aus? Hast du mehrere abgefragte Items? Oder hast du aus denen schon blockweise Mittelwerte erstellt und mit denen die t-Tests gerechnet?
Zur Auswahl der Korrelationen: Welche Sinn machen kannst du nur inhaltlich entscheiden: Wo macht es Sinn, bei zwei Variablen (Item oder Block) nach einem Zusammenhang zu untersuchen?
Zur Umsetzung: Arbeitest du mit SPSS? Dann kannst du die Streudiagramme über „Grafik“ erstellen. Dazu kannst du außerdem Korrelationen berechnen, bei Normalverteilung die Pearson-Korrelation, ansonsten Spearman-Korrelation (geht in SPSS über Analysieren -> Korrelation -> Bivariat).
Schöne Grüße
Daniela
Liebe Daniela,
große Klasse wie du hier Rede und Antwort stehst. Ich möchte mich auch mit zwei kleinen Frage einreihen (vermute aber schon, wie die Antwort lauten wird). Ich habe verschiedene Fragebögen aus unterschiedlichen Bereichen (Persönlichkeit, Engagement, Erschöpfung, etc.) an einer Stichprobe von n=20 erhoben. Diese Stichprobe wurde sodann (aufgrund des Testwerts einer der Fragebögen) in eine Risikogruppe und eine Nicht-Risikogruppe unterteilt. Nun habe ich untersucht inwieweit sich diese Gruppen in der Ausprägung der anderen Variablen unterscheiden – hierfür habe ich den t-test für unabhängige Stichproben gewählt, da die Gruppen ja jeweils andere VPs beinhalten. War das richtig? Oder handelt es sich doch um abhängige Stichproben (da beide Gruppen ja zur selben Stichprobe gehören)?. Und noch eine anschliessende Frage. In einer Bedingung beinhaltet die Risikogruppe nur n=3 Probanden (die Nicht-Risikogruppe entsprechend n=17). Ist es bei so einer kleinen Gruppe überhaupt möglich einen t-test zu rechnen (ich habe auf NV geprüft, diese ist trotz des kleinen Ns gegeben.) Vielen Dank für deine Antwort und Grüße
Christian
Hallo Christian,
zur ersten Frage: Das sind unabhängige Stichproben, die Testwahl passt also.
Zur zweiten Frage: Bei n=3 würde ich keinen Test mehr verwenden, der Normalverteilung voraussetzt. Stattdessen würde ich also den Mann-Whitney U nehmen. Wie hast du denn die Normalverteilung untersucht?
Schöne Grüße
Daniela
Hallo Daniela,
es handelt sich um eine retrospektive Studie. Ich möchte die Testergebnisse von Patienten unter 2 verschiedenen Therapieschemata miteinander vergleichen. Da ein Wechsel der Medikamente über die Zeit in beiden Gruppen erlaubt war, können einige Patienten in beiden Gruppen eingeschlossen sein. Ich habe als Einschlusskriterium eine Mindesteinnahmedauer von 6 Monaten vor dem jeweiligen Untersuchungszeitpunkt gewählt. Kann ich aufgrund des zeitlichen Kriteriums (6 Monate nach einem eventuellen Wechsel) und aufgrund dessen, dass die Ergebnisse unter einem Therapieschemata eindeutig der zugehörigen Gruppe zugeordnet sind, von 2 unabhängigen Stichproben ausgehen und entsprechende statistische Testverfahren anwenden, obwohl einige Patienten beiden Gruppen zugeordnet sind?
Vielen Dank für die Hilfe!
Svenja
Hallo Svenja,
streng genommen handelt es sich hier nicht um komplette unabhängige Stichproben. Ist es möglich, die „doppelten“ zu identifizieren und auszuschließen? Das wäre eine saubere Lösung.
Schöne Grüße
Daniela
Hallo Daniela,
erstmal vielen Dank für die schnelle Antwort!
Genau dieses Ausschließen hatte ich der Promotionsarbeitsgruppe auch vorgeschlagen. Mein „n“ würde aber dadurch zu stark abnehmen und eine weitere Begründung war, dass ich die Unabhängigkeit nicht mit einzelnen Patienten als Individuen, sondern mit den jeweiligen Patient mit klar definierter Medikamenteneinnahme beziehen solle !? Ich werde dies nun noch einmal klarer in meiner Dissertationsschrift begründen und trotz der nicht saubersten Lösung mit den statistischen Testverfahren für unabhängige Stichproben fortfahren.
Viele Grüße
Svenja
Hallo Svenja,
die Abhängigkeit besteht bei den Messungen am gleichen Patienten einfach dadurch, dass man zweimal am gleichen Patienten misst, einmal mit Medikament A, einmal mit B. Bei den nur einmal gemessenen ist das nicht der Fall. Deshalb sind hier verbundene und unverbundene Messungen gemischt und das ist für den Test nicht auseinander zu halten.
Schöne Grüße
Daniela
Liebe Frau Keller,
können Sie mir sagen, wie man einen Vorzeichentest in einer wissenschaftlichen Arbeit berichtet? Was muss außer dem p-Wert noch angegeben werden?
Viele Grüße
Marisa Diehl
Hallo Marisa,
es sollte die standardisierte Teststatistik (Z) und der p-Wert angegeben werden, eventuell noch die Fallzahl dazu.
Schöne Grüße
Daniela
Hallo Daniela,
viele Dank für die Schnelle Antwort. Ich habe den Vorzeichentest mit SPSS gerechnet, aber da wird gar kein Z-Wert ausgegeben.
Alles was SPSS augibt ist das:
Häufigkeiten
ratioLVVN – ratio_CCT N
Negative Differenzena 2
Positive Differenzenb 19
Bindungenc 0
Gesamt 21
a ratioLVVN ratio_CCTN
c ratioLVVN = ratio_CCTN
Statistik für Testa
ratioLVVN – ratio_CCTN
Exakte Signifikanz (2-seitig) ,000b
a Vorzeichentest
b Verwendetete Binomialverteilung.
Einen Z-Wert gibt SPSS nur aus, wenn stattdessen der Wilcoxon Test gerechnet wird. Allerdings haben meine Stichproben nicht die gleiche Verteilung, was ja eine der Voraussetzungen für den Wilcoxon Test ist. Deshalb wollte ich sicherheitshalber den Vorzeichen Test rechnen, weiß aber jetzt nicht genau, wie ich diesen berichten muss.
Viele Grüße
Marisa
Hallo Marisa,
wenn du (bei den neueren Versionen von SPSS) über Analysieren -> Nichtparametrische Tests -> Verbundene Stichproben gehst, bekommst du eine farbige Ausgabetabelle. Wenn du auf die klickst, öffnet sich ein neues Fenster mit mehr Infos. Da gibt es auch eine Teststatistik.
Schöne Grüße
Daniela
Vielen Dank für den Tipp!
Hallo Daniela,
ich möchte mich erst einmal für das sehr hilfreiche E-Book bedanken. Ich konnte damit die Kenntnisse aus dem Bachelor wieder auffrischen.
Nun arbeite ich an meiner Masterarbeit und stehe vor folgenden Schwierigkeiten bei der Auswertung meiner Daten.
Ich habe zwei Schulklassen (N=43) zu zwei Messzeitpunkten (Vorher-Nachher) eine Einschätzung ihrer Kompetenz durchführen lassen. Dies geschah mittels einer Likert-Skala von 1-5.
Ich habe mich daher nun für die Unterschiedsmessung für den Wilcoxon-Test entschieden, da es sich um abhängige Stichproben handelt und das Skalenniveau nicht eindeutig intervallskaliert ist.
Ich würde nun aber gerne zeigen in welchen Bereichen die Zunahme der Kompetenz besonders ausgeprägt war und in welchen Bereichen eher nicht. Muss ich hierzu die Effektstärke mit G*Power berechnen? Kann dies aber womöglich auch am Z-Wert abgelesen werden? Leider weiß ich nicht, was mir dieser Z-Wert aussagt, den SPSS ausgibt. Oder existiert hier ein anderer Test in SPSS? Im E-Book ist auf der Seite 18 die Rede von einem U-Wert. Welcher Wert ist dies in der SPSS-Ausgabe?
Des Weiteren soll ich vergleichen, ob Korrelationen vorliegen. Ich soll also darstellen, wenn der Kompetenzbereich X besonders zugenommen hat, der Kompetenzbereich Y mitgezogen hat, oder vielleicht sogar eher niedriger ist. Welchen Test kann ich hierzu verwenden?
Ich bin hier vor allem überfordert die Unterschiedszunahme korrelieren zu lassen.
Mein Betreuer hat mir empfohlen die vier Kompetenzbereiche (mit je 4-6 einzelnen Aussagen, die eben eingeschätzt werden sollen von 1-5) die ich auswerte und diskutiere je zu einem Mittelwert bzw. Median zusammenzufassen, um die Auswertung zu erleichtern. Ich sollte hierzu erst den Cronbachs alpha verwenden. Dieser ist jedoch in zwei Kompetenzbereichen unter 0,7 und 0,6. Auch durch Ausschluss einzelner Items lässt sich dieser nicht verbessern. Dies bedeutet doch, dass ich für diesen Bereich keinen gemeinsamen Median/Mittelwert ausgeben kann, um diesen mit den Median der anderen Bereiche zu vergleichen?
Ich würde mich sehr über Hilfe freuen.
Hallo Bianca,
schön, dass dir das E-Book nützlich ist! Ja, die Cronbachs Alpha Werte sind eigentlich zu niedrig. Am besten du besprichst mit deinem Betreuer, ob du dennoch die Werte zusammenfassen sollst.
Für die Korrelationen macht es wohl Sinn, mit Differenzwerten „Nachher minus Vorher“ zu arbeiten, die die Veränderung beschreiben. Diese kannst du dann für die verschiedenen Kompetenzen jeweils paarweise korrelieren.
Um die Stärke des Unterschieds zu messen bietet sich beim Wilcoxon das Effektstärkemaß r an (wird aus Z und N berechnet, siehe Blogbeitrag https://statistik-und-beratung.de/2015/07/effektstaerke/
Schöne Grüße
Daniela
Vielen lieben Dank für die Hilfe!
Hallo Daniela,
eine kurze Frage: Ich habe 18 Patienten, an denen ich genau dieselbe Messung des herzens einmal mittels Computertomographie und einmal mittels MRT mache. Ich möchte jetzt mittels T-Test vergleichen ob die beiden Methoden zu den selben Ergebnissen kommen. Ich muss doch dann einen T-Test mit verbunden Stichproben machen oder? Vielen Dank für deine Hilfe.
Lg Henning
Ja.
Schönen Gruß
Daniela
Hallo Daniela,
ich bin mir nicht ganz sicher, wie ich den Levene Test korrekt berichte.
Das ist mein Ergebnis aus SPSS:
majoraxis_N
Levene-Statistik df1 df2 Signifikanz
2,516 1 40 ,121
F(1,40) = 2,516 und p= 0.21. Würde das so stimmen? Vielen Dank im voraus!
Viele Grüße
Marisa
Hallo Marisa,
ja, bis auf den p-Wert, da ist ein Tippfehler, der muss p=0.121 lauten.
Schöne Grüße
Daniela
Hallo Daniela,
bei sämtlichen statistischen Berechnungen haben mir Deine gut nachvollziehbaren Erklärungen bereits geholfen. Nun bin ich aber etwas ratlos: Ich habe Daten aus einer Prä-Post-Messung (Fragebogen) einer Interventionsgruppe. Die Teilnehmer waren zwar Prä und Post die gleichen, jedoch können die Werte nicht Person A, B, C,.. im Vergleich zugeordnet werden, da es sich um eine anonyme Erhebung handelte.
Ein Test für verbundene Stichproben ist (meines Wissens nach) so nicht möglich. Kann ich auf einen für unabhängige SP ausweichen?
Vielen lieben Dank schon einmal!
Lieben Gruß, Ellen
Hallo Ellen,
streng genommen, kann in dem Fall gar kein Test verwendet werden. Verbunden geht ja nicht, weil die Zuordnung nicht vorhanden ist. Unverbunden stimmt auch nicht, weil die Daten ja abhängig sind. Alternative wäre eine rein deskriptive Auswertung ohne Tests.
Schöne Grüße
Daniela
Ich möchte meine vorherige Anfrage nochmals verbessern:
GuTa Daniela,
vielen Dank für diesen Block und die Beantwortung der Fragen!! Wirklich großartig!
Meine Frage ist die folgende.
Ich habe ein Produkt welches ist auf seine strukturelle Integrität mit einer Stoßdämpfungsprüfung teste. Es kommen exakte Kraftwerte heraus (in Newton, metrische Variable, intervallskaliert). Es gibt 4 Messpunkte (MP) an einem Produkt, von diesen MP muss ich dann wohl zuerst den Mittelwert bilden. Ich habe jeweils eine Stichprobe von 9 Objekten für die Kategorien a, b, c, d. Vergleichen möchte ich: a) neues Produkt b) künstlich gealtert *1* c) künstlich gealtert *2* d) natürlich gealtert.
Ich möchte rausfinden ob sich b), c) und d) von a) unterscheiden und wie stark. Ich möchte also jede Gruppe mit a) vergleichen.
Die Vorgehensweise wäre so, Hypothese H0 und H1 aufstellen.
Dann würde ich den T- Test für unabhängige Stichproben nehmen. Aufgrund der kleinen Stichprobe, müsste ich zunächst schauen, ob die Werte normalverteilt sind. Wenn nicht, müsste ich den U Test nehmen? Wäre das korrekt? Ich hoffe ich konnte alles gut schildern. Danke für die Mühe. VG Patrick
Hallo Patrick,
ja, dein Vorgehen ist so richtig.
Schöne Grüße
Daniela
Vielen Dank für die Hilfe und ihr E-Book „Grundlagen der statistischen Datenanalyse“, was ebenfalls sehr hilfreich ist.
Grüße Patrick
Hallo Daniela,
ich bin etwas über den letzten Absatz gestolpert und bitte um Hilfe.
Ich möchte eigentlich Patientendaten vergleichen. Hier habe ich Gruppen von Patienten, welche eine Therapie mehrfach bekommen haben. Ich habe nun Gruppen gebildet (1xTherapie = Gruppe 1, 2xTherapie = Gruppe 2, 3xTherapie oder öfter = Gruppe 3). Innerhalb dieser Gruppen wollte ich nun Änderungen von Werten vergleichen, dafür habe ich den Wilcoxon-Test benutzt. Da aber in Gruppe 3 Patienten mehrfach vertreten sind (nach 3.Therapie, nach 4. Therapie usw.) ist dies nicht zulässig?
Gibt es eine Alternative oder funktioniert diese Zusammenfassung so nicht?
Hallo Gerrit,
ja, das mehrfache Auftreten von Messwerten einer Person in einer Gruppe ist nicht zulässig. Eine Möglichkeit ist, von jeder Person nur einen Wert zu nehmen (z.B.von allen den ersten oder den letzten). Eine andere Möglichkeit ist, die Werte pro Patient zu mitteln.
Schöne Grüße
Daniela
Hallo Daniela, ich untersuche zwei Gruppen, die eine unterschiedliche Therapie erhalten haben (sozusagen alt vs. neu). Jetzt wurde jedem Patienten der „neuen“ Gruppe ein Matchingpartner aus der „alten“ Gruppe nach festgelegten Kriterien (Alter, best. Risikofaktoren) zugeordnet, die möglichst übereinstimmen sollten. Verglichen werden die Nebenwirkungen nach der Behandlung. Handelt es nach dem Matchingprozess noch um eine unverbundene oder verbundene Stichprobe?
Vielen Dank im Voraus!
VG Paul
Hallo Paul,
das ist nach dem Matching eine verbundene Stichprobe.
Schöne Grüße
Daniela
Hallo Daniela,
leider habe ich trotz des Lesens hier und deinen tollen Erklärungen im E-Book noch Fragen. Deine Abbildungen sind super und die Wege welche Statistik unter welchen Voraussetzungen gerechnet werden kann sehr einleuchtend, aber ich scheitere direkt beim Einstieg…
Sind diese Gruppen verbunden oder unverbunden?
Ich habe 30 Personen, d.h. 3 Gruppen mit je 10 Teilnehmern.
Untersuchungsmaterial: 60 verschiedene Aufgaben einer Aufgabenart, jede einzelne Aufgabe ist (durch kleine Änderungen) in 3 Variationen vorhanden.
Faktor Schwierigkeit in 3 Abstufungen
1. Gruppe 20 leicht, 20 mittel, 20 schwer
2. Gruppe 20 schwer, 20 leicht, 20 mittel
3. Gruppe 20 mittel, 20 schwer, 20 leicht
Ich möchte später vergleichen, wie sehr sich die Gruppen mit den
leicht-schwer und leicht-mittel Aufgaben unterscheiden.
Meine gemessenen Daten sind z.T. nicht normalverteilt, liegt das an den kleinen Gruppen? Mal abgesehen von der Ausgangsfrage der Verbundenheit oder nicht, wäre es sinnvoll alle Daten mit einem nichtparametrischen Verfahren zu berechnen?
Danke im Voraus für die Hilfe! 🙂
Hallo Mare,
was misst du? Welche Variable wird da untersucht?
Wenn du Gruppen vergleichst, sind die Stichproben unverbunden, denn in jeder Gruppe sind unterschiedliche Teilnehmer.
Wenn du teilweise nicht normalverteilte Daten hast, kannst du immer dann, wenn alle Parameter für eine Analyse (z.B. Variable 1 in allen Gruppen) normalverteilt sind, ein parametrisches Verfahren verwenden. Wenn alle oder ein Parameter nicht normalverteilt ist, nimmst du ein nichtparametrisches. Wenn das zu konfus wird, kannst du auch alle mit nichtparametrischen Verfahren analysieren, das ist auch bei Normalverteilung erlaubt.
Schöne Grüße
Daniela
Hallo Daniela,
danke für deine Antwort.
Gemessen wurden verschiedene Zeiten/Dauern. Inzwischen habe ich mich nochmal an die Daten gesetzt und mein Ausdruck der Gruppe war nicht gut gewählt. Meine Daten sind doch verbunden/abhängig und ich weiß nun auch, dass sie in der Bevölkerung nicht normalverteilt sind.
Danke für das Beispiel, das wäre auch meine Frage gewesen, ob man auch zwischen den Analyseverfahren wechseln kann. Wobei, das wäre mir doch zu kompliziert, da würde ich ganz durcheinander kommen.
Doch gut zu wissen, dass es so machbar wäre.
Danke dir!
Hallo Daniela,
ich messe in einer Notaufnahme über zwei Zeiträume die Aufenthaltsdauer aller neu eintreffenden Patienten und mittle diese jeweils.
In einem der Zeiträume ändere ich die Rahmenbedingungen in der Notaufnahme, welche sich sehr wahrscheinlich auf die Aufenthaltsdauer auswirken. Am Ende möchte ich die beiden Mittel (vor und nach der Einführung) vergleichen.
Ist dies nun gepaart, weil ich in der gleichen Notaufnahme die Daten über 2 Zeiträume erhebe und alle anderen Rahmenbedingungen gleich geblieben sind? Sonst könnte ich ja auch in 2 verschiedenen Notaufnahmen die Erhebung durchführen.
Oder ist es ungepaart, weil die einzelnen Aufenthaltsdauern von unterschiedlichen Individuen stammen?
Vielen Dank im Voraus!
Beste Grüße
Max
Hallo Maximilian,
die Daten sind hier ungepaart, da sie von verschiedenen Personen stammen. Für weitere spezielle Fragen – nicht den Blogbeitrag betreffend – kannst du meine Facebookgruppe Statistikfragen nutzen: https://www.facebook.com/groups/785900308158525/
Schöne Grüße
Daniela
Hallo,
ich habe eine Aufgabe vorliegen, es geht um die Arsen-Belastung des Trinkwassers in 2 Städten. Die Messwerte stammen jeweils aus 50 Wasserverteilungsknoten der beiden Städte (per Losverfahren ausgewählt usw.). Ich erkenne nicht, ob die situation gepaart oder ungepaart ist.Es ist im Prinzip die selbe Wasserleitung aber es werden ja verschiedene Städte in den Daten unterschieden.
Könnten Sie helfen?
LG
Ich würde mit diesen Infos sagen: ungepaart.
Schöne Grüße
Daniela
Liebe Daniela,
ich habe folgendes Problem:
Bei n=150 Patienten mit einer bestimmten Erkrankung wurden bei jedem Patienten einmalig 3 verschiedene Laborwerte A, B und C (=unabhänginge V.) gemessen. Mein Zielkriterium (=abhängige Variable) ist die 30-Tage-Letalität. Oberhalb eines jeweiligen Schwellenwertes gilt der Patient als A+ (n=60), B+ (n=40), C+ (n=20). Da es sich um Labortests des gleichen Organs handelt, können Patienten allerdings bspw. auch A+ und B+ sein.
Was ich vergleichen möchte:
Ich würde gern die Anzahl der Verstorbenen und Überlebenden der jeweiligen Tests miteinander vergleichen, also Verstorbene von A+ (12/60) vs. B+ (10/40) (sowie A+ vs C+ sowie B+ vs C+). Also immer ordinäre 4-Felder-Tafeln, aber eben jeweils mit Positiven zweier Tests. Also Bspw.
________A+ | B+
Verst. | 12 | 10
Überl. | 48 | 30
Die Frage ist nun: Ist dies aufgrund der u.U. Mehrfachpositiven und angesichts der Tatsache, dass alle 3 Werte in einer Population bestimmt wurden und nicht 3 Gruppen mit Untersuchung je eines Laborwerts gebildet wurden, überhaupt zulässig? Wenn es möglich sein sollte, wäre dann der angebrachte Test McNemar da es sich um eine verbundene Stichprobe handelt? Allerdings hätte ich mit diesem Test so meine Probleme, da er, so wie ich das verstanden habe, angibt, ob eine Veränderung (/ein Gruppenwechsel) erfolgt.
Vielen Dank im Voraus,
Marvin
…ich vergaß zu erwähnen, dass die Bestimmung von ABC zum gleichen Zeitpunkt erfolgt.
Liebe Grüße
Hallo Marvin,
ich denke, Du kannst nicht A+ mit B+ vergleichen, da ein Patient hier ja in beiden Gruppen enthalten sein könnte. Du könntest nur-A+ mit nurB+ mit A+-und-B+ und mit weder-A+-noch-B+ vergleichen. Das wäre dann ein Chi-Quadrat-Test. Würde diese Analyse Deine Fragestellung beantworten?
Schöne Grüße
Daniela
Ich hab im Bezug auf meine Masterarbeit eine Frage, welchen Test ich wählen soll. Und zwar habe ich bei 50 Patienten Perfusions-Parameter in verschiedenen Zonen der Prostata untersucht und würde gerne testen, ob sich die Paramter in den verschiedenen Zonen signifikant voneinander unterscheiden. Da die Zonen ja jeweils im gleichen Patienten gemessen wurden, sind die Gruppen gepaart oder? Ich habe mit dem Kolmogorov-Smirnov-Test die Gruppen jeweils auf Normalverteilung untersucht, das Problem ist, das manche normalverteilt sind, manche aber nicht. Also kann ich ja wahrscheinlich keinen ttest anwenden.
Also zu welcher Test würdet hier Sinn machen? Wenn Sie mir weiterhelfen könnten, wäre ich sehr dankbar.
Hallo Janina,
das sind gepaarte Stichproben, ja. Wenn nicht in jeder Gruppe Normalverteilung vorliegt und es 2 Gruppen sind, dann wäre das ein Mann-Whitney U Test. Bei mehr als zwei Gruppen der Kruskal-Wallis Test.
Weitere Fragen könnt Ihr gern in meiner Facebook-Gruppe Statistikfragen https://www.facebook.com/groups/785900308158525/ diskutieren.
Schöne Grüße
Daniela
Liebe Daniela, danke dir für deine tolle und hilfreiche Webseite!
Ich frage mich, ob man das verbunden/unverbunden-Problem lösen kann, indem man von jeder Person gleich viele Beobachtungen in die Stichprobe nimmt.
Ein fiktives Beispiel: Ich bitte 10 Leute, fünf verschiedene Autos (Mazda, Bentley, BMW…) nach bestimmten Merkmalen zu bewerten (Sportlichkeit, Umweltfreundlichkeit, etc.) (von 1-5) und dann abschließend zu sagen, welches sie kaufen würden (wie wahrscheinlich von 1-5). Ich möchte dann schauen, wie die verschiedenen Merkmale mit der Kaufabsicht zusammenhängen. Alle Variablen sind in dem Fall ordinalskaliert.
Ich denke mir, dass hier die Autos die Einheiten sind und nicht die Personen, weil sich ja beide Merkmale auf das Auto beziehen. D.h. ich habe eigentlich 50 Fälle (5 Autos von 10 Personen bewertet), und nicht nur 10 Fälle. Den Datensatz würde ich daher so aufbauen, dass die Zeilen die Autos sind (also die ersten drei Fälle wären P1_Mazda, P1_Bentley, P1_BMW, … wobei P1 die erste Interviewpartnerin war).
Jeweils fünf Fälle (Autos) sind aber nicht unabhängig voneinander, weil die Autos ja von der selben Person bewertet wurden (und z.B. für eine Person Umweltfreundlichkeit ein wichtigeres Kriterium sein könnte als für eine andere Person).
Meine Fragen:
1. Ist es zulässig, eine Korrelation über die ganze Stichprobe (d.h. 50 Autos) zu berechnen, wenn jede Person mit der selben Anzahl an Mehrfachmessungen (5 Autos) repräsentiert ist? Ich verstehe, dass es keinen Sinn machen würde, das zu tun, wenn z.B. P1 20 Autos bewertet hat, und P2 nur 3 Autos, weil dann die Bewertung von P1 viel stärker wiegen würde, aber wenn alle Personen gleich oft mehrfach vorkommen, müsste es sich doch ausgleichen, da alle gleich viel „wiegen“?
2. Wie gehe ich am besten vor, wenn ich schauen will, wie sich Autos, die sicher gekauft würden, und Autos, die gar nicht gekauft würden, unterscheiden? In dem Fall kann es ja sein, dass P1 zwei Autos mit „5“ (würde sicher kaufen), ein Auto mit „1“ (würde sicher nicht kaufen) und zwei Autos mit Werten dazwischen bewertet hat. Ich habe deinen Beitrag zu partiell verbundenen Stichproben gelesen (sehr verständlich!!). D.h. da würde ich dann so vorgehen, dass ich für jede Person die Mittelwerte berechne. D.h. wenn zwei Autos sicher gekauft würden, und das eine wurde als „sehr umweltfreundlich“ (5) und das andere als „eher umweltfreundlich“ (4), fasse ich das zu einem Auto mit dem Wert 4,5 zusammen. Ich habe dann zwei Stichproben, wo in der ersten Stichprobe von jeder Person nur ein „Mittelwert“-Auto drinnen ist, das sicher gekauft würde, und ich der zweiten Stichprobe habe ich von jeder Person nur ein „Mittelwert“-Auto drinnen ist, das sicher nicht gekauft würde. Innerhalb jeder Stichprobe kommt jede Person also nur einmal vor (d.h. 10 Fälle pro Stichprobe, insgesamt 20). Ich würde dann aufgrund der kleinen Stichprobengröße einen nicht-parametrischen Test für verbundene Stichproben nehmen (Wilcoxon Paarvergleichstest).
Denke ich in die richtige Richtung oder bin ich am Holzweg?
Herzlichen Dank im Voraus,
Aurelie
Hallo Aurelie,
langer Text… 🙂 Zur 1. Frage: nein, das ist streng genommen nicht zulässig.
Zur 2. Frage: ja, mit der Mittelwertbildung über die Autos hinweg funktoniert das so.
Schöne Grüße
Daniela