Hallo Forum!
Ich arbeite im Moment im Rahmen meiner Abschlussarbeit mit einem Datensatz, der N = 40 enthält, aufgeteilt in n = 20 pro Gruppe
Ich habe zuerst fehelnde Werte ersetzt (EM-Algo.), dann Outlier gesucht und entweder eliminiert oder "winsorized", je nach Plausibilität. Damit bin ich im Reinen.
Problem ist nun, dass durch die Elimination bei bestimmten Variablen quasi neue fehlende Werte enstanden sind. Muss ich diese nun erneut schätzen und ersetzen, bevor ich die Normalverteilung prüfen kann? Oder wäre es in Ordnung, dass die Teilstichproben dann einfach um jeweils 2 - 3 n kleiner werden (denn mehr Outlier waren es in keinem Fall!)?
So wie es jetzt aussieht (ohne Outlier) wird nämlich einiges signifikant, was ich gerne so lassen würde. Wenn ich die neu entstandenen fehlenden Werte (entstanden durch Löschen der Outlier) mittels EM schätze, sieht es schlechter aus.
In Lehrbüchern / sonst im Netz findet man zu fehlenden Werten, die durch Elimination von Outliern enstehen, sonst leider gar nichts.
Viele Grüße und Danke!