Es gibt bei der Fallzahlplanung in der Planungsphase zwei verschiedene Ansätze. Beim ersten Ansatz ist die Fallzahl gesucht. Dann müssen Annahmen über die Größe des Unterschieds vorab getroffen werden und es wird die benötigte Fallzahl berechnet. Beim zweiten Ansatz ist die maximal vorhandene Fallzahl bekannt und es soll ermittelt werden, welcher minimale Unterschied mit dieser Fallzahl höchstens als signifikant nachgewiesen werden kann.
Fallzahl für den Vergleich von zwei Gruppen: feste Größe des Unterschieds – gesuchte Fallzahl
Bei der Untersuchung eines Unterschieds kann die Größe des Unterschieds in der Effektstärke gemessen werden, z.B. mit Cohens d. d berechnet sich aus den Mittelwerten und Standardabweichungen der beiden Gruppen:
Ein d von 0,2 gilt als kleiner Effekt, ein Wert von 0,5 als mittlerer und ein Wert von 0,8 als großer Effekt (Cohen, 1992).
Beispiel 1:
Geplant ist eine Umfrage, mit der die Kundenzufriedenheit (metrischer Wert) zwischen Senioren und Nichtsenioren verglichen werden soll. Es soll auch ein kleiner Unterschied (Effektstärke d = 0,2) in der Kundenzufriedenheit zwischen Senioren und Nichtsenioren als signifikant nachgewiesen werden können. Es werden gleich viele Senioren und Nichtsenioren befragt.
Umsetzung in G*Power:
• Test family = t tests
• Statistical Test = Means: Difference between two independent means (two groups)
• Type of power analysis = A priori
• Tails: Two
• Effect size d: 0.2
• α: 0.05
• Power: 0.8
• Allocation ratio N2/N1: 1
Klicken auf „Calculate“ liefert als Stichprobengröße in JEDER Gruppe 394. Es müssen also mindestens 394 Senioren und 394 Nichtsenioren befragt werden, um diesen kleinen Effekt als signifikant nachzuweisen.
Beispiel 2:
Wie Beispiel 1. Es soll aber ausreichen einen mittleren Unterschied als signifikant nachweisen zu können: Effektstärke d = 0,5. Dann werden nur noch 64 Teilnehmer pro Gruppe gebraucht.
…
Du willst mehr Durchblick im Statistik-Dschungel?
Fallzahl für den Vergleich von zwei Gruppen: feste Fallzahl – gesuchte Stärke des Unterschieds
Beispiel 3:
Es ist eine medizinische Studie geplant, in der der Unterschied in einem Laborparameter bei zwei verschiedenen Behandlungsmethoden untersucht werden soll. Es steht eine maximale Fallzahl von 12 Patienten in jeder Gruppe zur Verfügung. Welcher Unterschied kann mit dieser Fallzahl höchstens als signifikant nachgewiesen werden?
Umsetzung mit G*Power:
• Test family = t tests
• Statistical Test = Means: Difference between two independent means (two groups)
• Type of power analysis = Sensitivity
• Tails: Two
• α: 0.05
• Power: 0.8
• Sample size group 1: 15
• Sample size group 2: 15
• Allocation ratio N2/N1: 1
Effektstärke d: 1.06. Es muss also ein extrem starker Effekt gemessen werden, um ihn mit dieser kleinen Stichprobe als signifikant nachweisen zu können.
Beispiel 4:
Wie Beispiel 3, nur mit einer Fallzahl von 30 in jeder Gruppe. Effektstärke d=0,74. Auch mit doppelt so vielen Patienten muss der Effekt noch groß sein, um ihn als signifikant nachweisen zu können.
Fallzahl für den Vergleich von zwei Messwiederholungen: feste Größe des Unterschieds – gesuchte Fallzahl
Beispiel 5:
Es wird die Veränderung eines Laborparameters vor und nach der OP untersucht (Messwiederholung an einer Gruppe). Es soll ein mittlerer Unterschied (d=0,5) signifikant nachweisbar sein. Wie viele Patienten sind dafür notwendig?
Umsetzung mit G*Power:
• Test family = t tests
• Statistical Test = Means: Difference between two dependent means (matched pairs)
• Type of power analysis = A priori
• Tails: Two
• Effect size d: 0.5
• α: 0.05
• Power: 0.8
Die Berechnung liefert als benötigte Patientenzahl 34.
Fallzahl für den Vergleich von zwei Messwiederholungen: feste Fallzahl – gesuchte Stärke des Unterschieds
Beispiel 6:
Nun soll an 20 Patienten die Veränderung des Laborparameters vor und nach der OP untersucht werden. Welcher Unterschied ist damit höchstens als signifikant nachweisbar?
Umsetzung mit G*Power:
• Test family = t tests
• Statistical Test = Means: Difference between two dependent means (matched pairs)
• Type of power analysis = Sensitivity
• Tails: Two
• α: 0.05
• Power: 0.8
• Total sample size: 20
Die Berechnung liefert eine Effektstärke von 0,66. Also kann ein mittlerer bis starker Effekt mit den 20 Patienten nachgewiesen werden. Ist der Effekt kleiner, so wird der Test kein signifikantes Ergebnis haben.
Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155-159.
…
Ich bin Statistik-Expertin aus Leidenschaft und bringe Dir auf leicht verständliche Weise und anwendungsorientiert die statistische Datenanalyse bei. Mit meinen praxisrelevanten Inhalten und hilfreichen Tipps wirst Du statistisch kompetenter und bringst Dein Projekt einen großen Schritt voran.
Hallo! Wie kann ich mit G-Power berechnen, welcher zahlenmäßige Unterschied zwischen zwei Gruppen maximal erlaubt ist, um einen t-test machen zu können? Ich möchte herausfinden, ob ich die Gruppen erst reduzieren muss und auf welche Gruppengröße die größere „schrumpfen“ muss, damit die beiden Gruppen vergleichbar sind!
Danke schon einmal im Voraus!
Hallo Veronika,
dafür gibt es keine Regel. Die Gruppen dürfen für den t-Test unterschiedlich groß sein. Es gilt aber Normalverteilung und Varianzhomogenität, das musst Du also prüfen. Die Gruppengröße ist aber nicht ausschlaggebend für die Wahl des Tests.
Weitere Fragen könnt Ihr gern in meiner Facebook-Gruppe Statistikfragen https://www.facebook.com/groups/785900308158525/ diskutieren.
Schöne Grüße
Daniela
Hallo
Ich bin dabei meine Masterarbeit zu schreiben aber habe ein paar Probleme. Für meine Studie muss ich wissen, wie viele Probanden ich wirklich benötige und dafür muss ich eine Fallzahlberechnung machen aber ich weiß leider nicht wie ich das machen muss.
Danke im Voraus
Viele Grüße
Hallo,
um die Fallzahl zu ermitteln, brauchst Du ein paar Infos vorab:
1. Welchen Test planst Du?
2. Welches Ergebnis erwartest Du (Größe des Unterschieds oder Zusammenhangs)?
Für die Fallzahlberechnung brauchst Du dann spezielle Software, z.B. G*Power.
Liebe Grüße
Daniela
Hallo,
kämpfe gerade mit der Fallzahlberechnung. Ich vergleiche 2 Labortests an ein und der selben Blutprobe, und will wissen welcher Test besser geeignet ist, die Diagnose zu stellen (also möglichst hoher positiv prädiktiver Wert, wenig falsch positive oder falsch negative, hohe Sensitivität usw.). Die Inzidenz der Diagnose in der getesteten Population ist ca 0,8%. Bei G*Power habe ich eingegeben:
• Test family = Exact
• Statistical Test = Proportions: Difference between two dependent means (matched pairs)
• Type of power analysis = a priori
• Tails: One
• α: 0.05
• Power: 0.8
Demnach bräuchte in 90 Probanden? Kommt mir so wenig vor bei der geringen Inzidenz für die Diagnose?? Wo habe ich da einen Denkfehler?
Vielen Dank für die Hilfe!
Hallo Anja,
mit dem Test, den Du in G*Power geplant hast, würdest Du untersuchen, ob die Tests unterschiedlich ausfallen (unterschiedliche Anzahl an positiven/negativen). Dafür müsstest Du aber auch irgendwo die erwarteten Anteile angegeben haben. Das kann ich aus Deinen Angaben nicht herauslesen.
Bei richtiger Angabe der erwarteten Anteile (sehr gering wegen der geringen Inzidenz) müsste dann eine deutlich größere Fallzahl herauskommen.
Aber ich weiß nicht, ob das wirklich das ist, was Dich hier inhaltlich interessiert: Ob sich die beiden Tests in den getesteten Anteilen unterscheiden. Vielleicht ist es eher interessant nachzuweisen, dass ein Test über bestimmten Werten für Sensitivität und Spezifität liegt?
LG Daniela
P.S: Wenn Du dazu mehr mit mir zusammen arbeiten willst, komm doch in die Statistik-Akademie: https://statistik-und-beratung.de/mitgliederbereich-lp/ Hier bekommst Du Antworten auf alle Deine Fragen zur Statistik und viel Material zum Statistik verstehen und anwenden von mir.
Hallo, ich bin in diesen Dingen absoluter Laie, arbeite als Historiker und würde gern einmal wissen, wie man herausfinden kann, welcher prozentuale Anteil von Teilnehmern einer Demonstration eine bestimmte Meinung vertritt. Ich vermute mal: Wieviel Prozent der Demonstranten ich befragen müßte, hängt davon ab, wie genau das Ergebnis sein soll. Wie wäre es bei einer 80prozentigen Richtigkeit zum Beispiel? Gibt es da eine Formel? Mit Dank im vorhinein und vielen Grüßen: Erhard.
Hallo Erhard,
vielen Dank für Deine Frage. Ja, Du hast recht: Wieviele Du befragen musst hängt von der gewünschten Genauigkeit ab. Es hängt aber auch davon ab, welchen Anteilswert Du erwartest (eher 20 % oder eher 60 % oder…). Und bei der Genauigkeit spielen zwei Dinge eine Rolle: Die Breite des Konfidenzintervalls, das Du angeben willst (je breiter, desto ungenauer) und die Sicherheitswahrscheinlichkeit des Konfidenzintervalls (je höher, desto sicherer). Du könntest z.B. sagen, dass Du ein Ergebnis von 20% erwartest und dafür ein 95%-Konfidenzintervall (Wahrscheinlichkeit 95%) der Breite 10 angeben willst (von 15% bis 25%).
Mit diesen Angaben lässt sich dann die Fallzahl ermitteln.
Schau Dir dazu diesen Blogartikel an: https://statistik-und-beratung.de/2014/09/fallzahlberechnung-fuer-haeufigkeiten-mit-angabe-eines-konfidenzintervalls/
LG Daniela
P.S: Wenn Du dazu mehr mit mir zusammen arbeiten willst, komm doch in die Statistik-Akademie: https://statistik-und-beratung.de/mitgliederbereich-lp/ Hier bekommst Du Antworten auf alle Deine Fragen zur Statistik und viel Material zum Statistik verstehen und anwenden von mir.
Fallzahl für den Vergleich von drei Messwiederholungen: feste Fallzahl – gesuchte Stärke des unterschieds.
Es soll von 20 Patienten der Effekt einer Behandlung auf bestimmte Parameter im Blut angeschaut werden. Das Blut wird vor der Behandlung abgenommen und zwei mal danach ( nach 6 und 12 Monaten). Es soll ein mittlerer Unterschied nachgewiesen werden. Wie analysiere ich hier die effektstärke mit G power? Könntest du mit hierbei bitte helfen? Danke
Hallo Simone,
die Analyse später wird wohl (wenn die Voraussetzungen erfüllt sind) auf eine Varianzanalyse mit Messwiederholung hinaus laufen. Da ist das Effekstärkemaß das Eta-Quadrat. Ein Wert von 0,09 gilt da ca. als mittlerer Effekt. Basierend darauf kannst Du mit G*Power die Fallzahl ausrechnen.
LG Daniela
P.S.: Willst Du mehr mit mir zusammen arbeiten und auf all Deine Fragen zur Statistik schnelle zielgerichtete Antworten von mir? Dann komm in die Statistik-Akademie: https://statistik-und-beratung.de/mitgliederbereich-lp/
Hallo Daniela,
ich schreibe gerade meine Bacheorarbeit und bin mir nicht ganz sicher, welchen Test ich überhaupt machen muss. Den correlation: point biseral mode oder difference between usw.
Meine Forschungsfrage lautet: Gibt es Unterschiede in Abhängigkeit vom Geschlecht, ob und wie stark ein Zusammenhang zwischen einer exzessiven Smartphone-Nutzung und depressiven Verstimmungen in der ALtersgruppe xy besteht?
Ich will also vergleichen, ob es einen Zsh. bei den Männern zwischen der Smartphone-Nutzung und depr. Verstimmungen gibt und wenn ja, wie stark der ist. Und das Gleiche bei den Frauen. Dafür will ich einen FRagebogen entwerfen, der zu Beginn das Geschlecht abfrägt.
Vielleicht kannst du mir weiterhelfen. Effekt soll mittel sein und Alpha-Fehler 0.05..
Danke und liebe Grüße, Laura
Hallo Laura,
sind das zwei Hypothesen? Also eine für Männer und eine für Frauen? Dann basierst Du Deine Fallzahlplanung auf einer Korrelation (vermutlich Pearson, wenn beide Variablen metrisch sind und Du mit Normalverteilung planst).
Es könnte aber auch sein, dass Du eine Hypothese hast, die besagt, ob es einen Unterschied im Zusammenhang der beiden Variablen zwischen den Geschlechtern gibt. Dann wäre das eine Moderationsanalyse und Du müsstest dafür die Fallzahl bestimmen.
LG Daniela