Es gibt verschiedene Arten von fehlenden Werten. Welche das sind und was das bedeutet, erkläre ich Dir in diesem Video.

MCAR: Missing completely at random
• Rein zufällig fehlend
• Fehlen ist weder von der eigentlichen Variablen noch von anderen Variablen abhängig
• Können ignoriert werden

MAR: Missing at random
• Fehlen ist unabhängig von der Variable selbst, bei der der Wert fehlt
• Fehlen ist abhängig von anderen Variablen im Datensatz
• Bei Ignorieren wird das Ergebnis verzerrt, die Beziehungen zwischen den Parametern (z.B. in Regressionen) bleiben unverzerrt
Beispiel: Frauen geben ihr Alter seltener an als Männer, ist unabhängig vom Alter der Frau.

NMAR: Not missing at random
• Fehlen hängt von der fehlenden Variable selbst ab
• Fehlen hängt eventuell auch von anderen Variablen im Datensatz ab
• Bei Ignorieren wird das Ergebnis und auch das Ergebnis für Beziehungen zwischen den Parametern verzerrt
Beispiel: Ältere Frauen geben ihr Alter seltener an als jüngere Frauen und als Männer.