In diesem Beitrag finden Sie Beispiele von Fallzahlberechnungen für den Vergleich von zwei Gruppen, umgesetzt mit der frei verfügbaren Software G*Power. Ähnlich kann mit jeder anderen Software zur Fallzahlberechnung vorgegangen werden. Der Einfachheit halber werden die Beispiele nur für die parametrischen Methoden verwendet, die Normalverteilung der Daten voraussetzen. Sie sind aber genauso für die nichtparametrischen Verfahren möglich.

Es gibt bei der Fallzahlplanung in der Planungsphase zwei verschiedene Ansätze. Beim ersten Ansatz ist die Fallzahl gesucht. Dann müssen Annahmen über die Größe des Unterschieds vorab getroffen werden und es wird die benötigte Fallzahl berechnet. Beim zweiten Ansatz ist die maximal vorhandene Fallzahl bekannt und es soll ermittelt werden, welcher minimale Unterschied mit dieser Fallzahl höchstens als signifikant nachgewiesen werden kann.

Fallzahl für den Vergleich von zwei Gruppen: feste Größe des Unterschieds – gesuchte Fallzahl

Bei der Untersuchung eines Unterschieds kann die Größe des Unterschieds in der Effektstärke gemessen werden, z.B. mit Cohens d. d berechnet sich aus den Mittelwerten und Standardabweichungen der beiden Gruppen:

Ein d von 0,2 gilt als kleiner Effekt, ein Wert von 0,5 als mittlerer und ein Wert von 0,8 als großer Effekt (Cohen, 1992).

Beispiel 1:

Geplant ist eine Umfrage, mit der die Kundenzufriedenheit (metrischer Wert) zwischen Senioren und Nichtsenioren verglichen werden soll. Es soll auch ein kleiner Unterschied (Effektstärke d = 0,2) in der Kundenzufriedenheit zwischen Senioren und Nichtsenioren als signifikant nachgewiesen werden können. Es werden gleich viele Senioren und Nichtsenioren befragt.

Umsetzung in G*Power:
• Test family = t tests
• Statistical Test = Means: Difference between two independent means (two groups)
• Type of power analysis = A priori
• Tails: Two
• Effect size d: 0.2
• α: 0.05
• Power: 0.8
• Allocation ratio N2/N1: 1

Klicken auf „Calculate“ liefert als Stichprobengröße in JEDER Gruppe 394. Es müssen also mindestens 394 Senioren und 394 Nichtsenioren befragt werden, um diesen kleinen Effekt als signifikant nachzuweisen.

Beispiel 2:

Wie Beispiel 1. Es soll aber ausreichen einen mittleren Unterschied als signifikant nachweisen zu können: Effektstärke d = 0,5. Dann werden nur noch 64 Teilnehmer pro Gruppe gebraucht.

 

Du willst mehr Durchblick im Statistik-Dschungel?

Fallzahl für den Vergleich von zwei Gruppen: feste Fallzahl – gesuchte Stärke des Unterschieds

Beispiel 3:

Es ist eine medizinische Studie geplant, in der der Unterschied in einem Laborparameter bei zwei verschiedenen Behandlungsmethoden untersucht werden soll. Es steht eine maximale Fallzahl von 12 Patienten in jeder Gruppe zur Verfügung. Welcher Unterschied kann mit dieser Fallzahl höchstens als signifikant nachgewiesen werden?

Umsetzung mit G*Power:
• Test family = t tests
• Statistical Test = Means: Difference between two independent means (two groups)
• Type of power analysis = Sensitivity
• Tails: Two
• α: 0.05
• Power: 0.8
• Sample size group 1: 15
• Sample size group 2: 15
• Allocation ratio N2/N1: 1

Effektstärke d: 1.06. Es muss also ein extrem starker Effekt gemessen werden, um ihn mit dieser kleinen Stichprobe als signifikant nachweisen zu können.

Beispiel 4:

Wie Beispiel 3, nur mit einer Fallzahl von 30 in jeder Gruppe. Effektstärke d=0,74. Auch mit doppelt so vielen Patienten muss der Effekt noch groß sein, um ihn als signifikant nachweisen zu können.

Fallzahl für den Vergleich von zwei Messwiederholungen: feste Größe des Unterschieds – gesuchte Fallzahl

Beispiel 5:

Es wird die Veränderung eines Laborparameters vor und nach der OP untersucht (Messwiederholung an einer Gruppe). Es soll ein mittlerer Unterschied (d=0,5) signifikant nachweisbar sein. Wie viele Patienten sind dafür notwendig?

Umsetzung mit G*Power:

• Test family = t tests
• Statistical Test = Means: Difference between two dependent means (matched pairs)
• Type of power analysis = A priori
• Tails: Two
• Effect size d: 0.5
• α: 0.05
• Power: 0.8

Die Berechnung liefert als benötigte Patientenzahl 34.

Fallzahl für den Vergleich von zwei Messwiederholungen: feste Fallzahl – gesuchte Stärke des Unterschieds

Beispiel 6:

Nun soll an 20 Patienten die Veränderung des Laborparameters vor und nach der OP untersucht werden. Welcher Unterschied ist damit höchstens als signifikant nachweisbar?

Umsetzung mit G*Power:
• Test family = t tests
• Statistical Test = Means: Difference between two dependent means (matched pairs)
• Type of power analysis = Sensitivity
• Tails: Two
• α: 0.05
• Power: 0.8
• Total sample size: 20

Die Berechnung liefert eine Effektstärke von 0,66. Also kann ein mittlerer bis starker Effekt mit den 20 Patienten nachgewiesen werden. Ist der Effekt kleiner, so wird der Test kein signifikantes Ergebnis haben.

Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155-159.