Gemischte Modelle sind statistische Methoden, die in vielen Disziplinen, von der Medizin bis zur Sozialwissenschaft, verwendet werden, um Daten zu analysieren, die sowohl feste als auch zufällige Effekte beinhalten. Deshalb auch der Begriff „gemischt“ = fest und zufällig. Dagegen beinhalten klassische Modelle wie die ANOVA oder Regression nur feste Effekte.
Was sind gemischte Modelle?
Gemischte Modelle, auch bekannt als „Mixed-Effects-Modelle“, „Hierarchische Modelle“ oder „Multi-Level-Models“, kombinieren zwei Arten von Effekten:
1. Feste Effekte (Fixed Effects): Diese Effekte repräsentieren systematische Einflüsse, die auf alle Beobachtungen gleich wirken. Ein Beispiel für einen festen Effekt wäre der Einfluss eines Medikaments auf eine Gruppe von Patienten, bei dem angenommen wird, dass das Medikament in gleicher Weise auf alle Personen wirkt. Feste Effekte sind die unabhängigen Variablen, die du aus klassischen Modellen wie der ANOVA oder der Regression kennst.
2. Zufällige Effekte (Random Effects): Diese Effekte erfassen die Variabilität zwischen Gruppen oder Einheiten, die nicht systematisch, sondern zufällig ist. Ein klassisches Beispiel wäre der Effekt, den unterschiedliche Ärzte bei der Verabreichung eines Medikaments haben könnten – diese Effekte können als zufällig betrachtet werden, da sie nicht gleichbleibend für alle Ärzte sind.
Gemischte Modelle erlauben es also, sowohl systematische als auch zufällige Variabilität in den Daten zu berücksichtigen. Das macht sie besonders nützlich, wenn Daten hierarchisch oder verschachtelt sind, wie es bei wiederholten Messungen oder Multilevel-Daten häufig der Fall ist.
Anwendung von gemischten Modellen
Gemischte Modelle finden in einer Vielzahl von Anwendungsbereichen Verwendung. Hier sind ein paar Beispiele:
– Medizinische Studien: In der medizinischen Forschung können gemischte Modelle eingesetzt werden, um die Auswirkungen eines Behandlungsansatzes zu analysieren, während beispielsweise die Struktur von Zentrum und Arzt mit berücksichtigt wird und unterschiedliche Ausgangslage bzw. unterschiedliche Effekte abhängig von Zentrum und behandeldem Arzt modelliert werden.
– Sozialwissenschaften: In Umfragen, bei denen Daten von Personen in Haushalten gesammelt werden, müssen gemischte Modelle verwendet werden, um einerseits die abhängige Struktur der Daten (Personen innerhalb eines Haushalts sind voneinander abhängig) richtig modellieren zu können. Andererseits können dann auch Parameter, die auf Haushaltsebene erhoben wurden, im Modell untersucht werden.
– Psychologie: In Tagebuchstudien können gemischte Modelle sehr nütztlich sein, weil sie auch mit unvollständigen Daten arbeiten können. Wenn also eine Person nicht durchgehend die Einträge ins Tagebuch vorgenommen hat, kann sie trotzdem mit im Modell untersucht werden (ohne dass die fehlenden Werte imputiert werden).
Vorteile gemischter Modelle
Gemischte Modelle bieten mehrere wichtige Vorteile gegenüber traditionellen statistischen Methoden wie linearen Regressionsmodellen:
– Berücksichtigung von Abhängigkeiten: Da viele Daten hierarchisch strukturiert sind (z. B. Messungen von verschiedenen Patienten, Schulen oder Regionen), können gemischte Modelle diese Abhängigkeiten zwischen den Beobachtungen besser abbilden. Dadurch werden Verzerrungen minimiert, die durch die Annahme unabhängiger Beobachtungen entstehen würden.
– Mehr Flexibilität: Da gemischte Modelle sowohl feste als auch zufällige Effekte modellieren können und auch die Kovarianzstruktur und Schätzmethode flexibel gewählt werden kann, bieten sie mehr Flexibilität und eine genauere Anpassung an die Daten als einfache (verallgemeinerte) lineare Modelle wie z.B. die MANOVA.
Verschiedene Modelltypen
Wie auch bei den klassischen Modellen gibt es verschiedene Modelltypen, die vom Variablentyp der abhängigen Variablen bestimmt sind:
– Lineare gemischte Modelle (LMM): Diese werden verwendet, wenn die abhängige Variable metrisch ist. Das ist also das Pendant zum Linearen Modell (ANOVA oder lineare Regression).
– Verallgemeinerte lineare gemischte Modelle (GLMM): Diese kommen zum Einsatz, wenn die abhängige Variable nicht metrisch ist. Hier sind unterschiedliche Variablentypen möglich. Zum Beispiel dichotom (Gesund ja/nein), nominal (rot, gelb, grün, blau), Zähldaten (Anzahl Paar Schuhe im Schrank). Genauso wie beim Verallgemeinerten Linearen Modell werden hier Linkfunktion und Verteilung passend gewählt.
Herausforderungen bei gemischten Modellen
Mit der enormen Flexibilität bringen diese Modelle auch einige Herausforderungen bei der Anwendung mit. Die Auswahl der richtigen festen und zufälligen Effekte, der Schätzmethode und auch der passenden Kovarianzstruktur kann schwierig sein und eine falsche Spezifikation des Modells kann zu verzerrten Ergebnissen führen oder die Software findet gar kein Ergebnis.
Die Komplexität des Modells und das Rechnen mehrerer Modelle für den Modellvergleich machen die Interpretation umfangreich und damit schwieriger als bei einfacheren Modellen. Außerdem kann nicht jede Statistiksoftware alle Modelle mit aller Flexibilität umsetzen.
Es lohnt sich!
Trotz der Herausforderungen sind gemischte Modelle mächtige Werkzeuge für die Analyse von Daten. Je nach Situation kann es sein, dass du sie einsetzen musst. Und selbst wenn der Einsatz für dich optional ist, lohnt sich die Beschäftigung mit diesem Themenkomplex aus meiner Sicht sehr. Durch die Flexibilität gewinnt deine Auswertung an Qualität. Und auch dein Wissen und Können im Bereich Statistik wird zunehmen, wenn du dich mit diesem spannenden Thema befasst.
In ähnlichen Situationen können manchmal auch Verallgemeinerte Schätzgleichungen (Generalized Estimating Equations, GEE) eingesetzt werden. Was die Unterschiede und Gemeinsamkeiten sind, erkläre ich dir in diesem Blogartikel (klick).
Wenn du hier mehr Unterstützung suchst, komm in die Statistik-Akademie. Dort gibt es mehrere Video-Seminare, in denen ich dir dieses komplexe Thema in verständlichen Worten erkläre. Du findest dort auch Software-Tutorials für die Umsetzung mit SPSS und R. Dort zeige ich dir an Beispielen (die du auch als Beispieldaten herunterladen kannst), wie genau solche Modelle gerechnet und die Ergebnisse interpretiert werden. Das ist die Abkürzung für dich. Damit wirst du es leicht haben, diese Modelle auch auf deine Daten und deine Fragestellungen anzuwenden.
Die 10 häufigsten Fehler bei Abschlussarbeiten mit SPSS und wie du sie vermeidest.
Hol dir jetzt die Liste für 0,- Euro und komm mit deiner Datenanalyse fehlerfrei und schnell voran!

Ich bin Statistik-Expertin aus Leidenschaft und bringe Dir auf leicht verständliche Weise und anwendungsorientiert die statistische Datenanalyse bei. Mit meinen praxisrelevanten Inhalten und hilfreichen Tipps wirst Du statistisch kompetenter und bringst Dein Projekt einen großen Schritt voran.
Hallo! Vielen Dank mal wieder für die tollen Erläuterungen, die mir auch bzgl. anderer Themen hier schon wiederholt enorm während meines Studiums geholfen haben.
Ich habe ein linear mixed-effects model für die Auswertung von Ergebnissen einer Multi-Center-Studie mit SPSS berechnet (eine Behandlungs- und eine Placebogruppe, Post- und FU-MZP, random intercept für Study centre und Studienteilnehmer:in, fixed effects für Alter, IQ, Maß zu Baseline in dem jeweiligen Outcome). Nun möchte ich noch die standardisierte Effektstärken für den Gruppenunterschied mit 95%igen Konfidenzintervallen berechnen. Bislang habe ich Effektstärken immer mit der Info der Standardabweichungen und der Mittelwerte berechnet. Nun habe ich zum ersten Mal mit diesen Modell gearbeitet und SPSS gibt in diesem Fall ja die geschätzten MW des Modells und den Standardfehler aus, sowie den 95%igen CI und die p-Werte. Ich frage mich wie ich anhand der Informationen die Effektstärken berechnen kann? Gibt es hierfür einen Weg in SPSS?
Zudem habe ich ein Outcome bei dem das Modell nicht mit dem random intercept konvergiert. Ansonten scheint der Modellfit gut zu sein. Hier frage ich mich auch, ob es eine andere Lösung geben könnte als den random intercept für Subjekt und Centre wegzulassen?
Ich würde mich sehr über einen kurzen Tipp freuen, wenn möglich.
Hallo Fabienne,
vielen Dank für deine Frage. Das freut mich sehr, dass dir meine Seite so hilft!!
Erstmal zur zweiten Frage, der Nicht-Konvergenz: Ich würde nicht beide random intercepts weglassen, zumindest nicht, wenn du nicht weißt, dass sie unwichtig sind. Außerdem wäre ohne die beiden random intercepts ja gar kein gemischtes Modell notwendig. Hast du den ICC des Nullmodells mal angeschaut? Wie groß ist der? Daran kannst du sehen, ob du auch ohne die hierarchische Struktur arbeiten könntest (also z.B. eine Regression).
Zu den Effektstärken:
Es gibt noch nicht die eine etablierte Herangehensweise an dieses Thema (vielleicht wird es die auch nie geben), denn die Effektstärken können für solche komplexen Modelle auf sehr unterschiedliche Weise berechnet werden. Es gibt (noch) keine gute Methode, um ein Effektstärkemaß für feste Effekte in gemischten Modellen anzugeben. In diesem Paper von Julie Lorah (2018) werden verschiedene Möglichkeiten aufgezeigt:
https://largescaleassessmentsineducation.springeropen.com/articles/10.1186/s40536-018-0061-2
Lorah, J. Effect size measures for multilevel models: definition, interpretation, and TIMSS example. Large-scale Assess Educ 6, 8 (2018). https://doi.org/10.1186/s40536-018-0061-2
Wenn du mehr Input zu Statistik suchst und Antworten auf deine Fragen, dann komm in die Statisitk-Akademie:
https://www.statistik-akademie.de/akademie/
LG Daniela
Liebe Daniela, erst einmal vielen herzlichen Dank für die so schnelle, erneut hilfreiche Rückmeldung, die ich leider erst jetzt sehe! Das hilft mir schon sehr weiter mit dem Verweis auf das Paper, den Hinweis zu der Nicht-Konvergenz und auch auf die Statistik-Akademie. Die kannte ich bisher noch nicht und werde diese bei den nächsten Fragestellungen ausprobieren. Vielen herzlichen Dank für diese tollen Angebote mit der Seite und der Akademie, bei denen m.E.n. Statistik auf eine beeindruckend einfache und verständliche Art erklärt wird! Viele Grüße, Fabienne
Das freut mich sehr! Vielen Dank für die Rückmeldung!
LG Daniela