Es gibt verschiedene Arten von fehlenden Werten. Welche das sind und was das bedeutet, erkläre ich Dir in diesem Video.
MCAR: Missing completely at random
• Rein zufällig fehlend
• Fehlen ist weder von der eigentlichen Variablen noch von anderen Variablen abhängig
• Können ignoriert werden
MAR: Missing at random
• Fehlen ist unabhängig von der Variable selbst, bei der der Wert fehlt
• Fehlen ist abhängig von anderen Variablen im Datensatz
• Bei Ignorieren wird das Ergebnis verzerrt, die Beziehungen zwischen den Parametern (z.B. in Regressionen) bleiben unverzerrt
Beispiel: Frauen geben ihr Alter seltener an als Männer, ist unabhängig vom Alter der Frau.
NMAR: Not missing at random
• Fehlen hängt von der fehlenden Variable selbst ab
• Fehlen hängt eventuell auch von anderen Variablen im Datensatz ab
• Bei Ignorieren wird das Ergebnis und auch das Ergebnis für Beziehungen zwischen den Parametern verzerrt
Beispiel: Ältere Frauen geben ihr Alter seltener an als jüngere Frauen und als Männer.
Ich bin Statistik-Expertin aus Leidenschaft und bringe Dir auf leicht verständliche Weise und anwendungsorientiert die statistische Datenanalyse bei. Mit meinen praxisrelevanten Inhalten und hilfreichen Tipps wirst Du statistisch kompetenter und bringst Dein Projekt einen großen Schritt voran.