Hallo!
Vereinfacht gesprochen: Ich habe einen Datensatz, der jeweils 3 Variablen (1, 2, 3) zu 4 (A, B, C, D) Teilaufgaben beinhaltet. Das Datenmuster ist also so:
A1, A2, A3, B1, B2, B3, C1, C2, C3, D1, D2, D3
Meine Stichprobe sind 69 VPs (Kinder).
Nun habe ich etliche fehlende Werte (je nach Variable 12-69%), die sich daraus ergaben, dass manche Aufgaben aus Gründen der Verweigerung des Kindes, einem VL-Fehler, technischen Problemen, etc. nicht durchgeführt bzw. ausgewertet werden konnten. Das heißt, dass z.B. VP1 nur Werte auf A, B und C, aber fehlende Werte auf D hat; VP2 fehlende Werte auf A und B; VP3 fehlende Werte auf C, etc.
Ich möchte inferenzstatistisch, also hypothesengeleitet, mit dem Datensatz arbeiten. Leider ist der Großteil der Variablen nicht normalverteilt. Der Little's Test zeigt ein Missing Completely at Random (MCAR) an. Ist in dem Fall ein paarweiser Fallauschluss in Ordnung oder wäre eine Imputationsmethode vorzuziehen? Bzw. macht eine Imputation überhaupt Sinn, da die Werte von Kind 5 ja schlecht durch die Werte von Kind 17 vorherzusagen sind?
Vielen Dank vorab!