Hallo zusammen!
Für meine Masterarbeit habe ich eine Umfrage gemacht, die mit einer logistischen Regression ausgewertet werden soll. Die Stichprobengröße ist n=1072, allerdings habe ich relativ viele fehlende Werte. Diese kommen zum Einen durch die Filterführung zu Stande, wodurch direkt zu Beginn des Fragebogens ungefähr 90 Personen aussortiert werden. Außerdem habe ich recht viele unabhängige Variablen in der Untersuchung und für diese Variablen war im Fragebogen jeweils die Antwortoption "Keine Angabe" vorhanden, wodruch viele weitere Fälle im Datensatz sind, die mindestens einen fehlenden Wert haben.
Von den 1072 Fällen haben insgesamt 262 Fälle (24,4%) einen fehlenden Wert. Sollte ich diese Fälle nun aus der Untersuchung ausschließen (dies würde SPSS meines Wissens nach für die logistische Regression ja automatisch machen) oder soll ich mit den Werten anders verfahren? Ich habe nämlich des Öfteren gelesen, dass dieses Vorgehen eher geeignet ist, wenn die Missingquote um ca. 5% liegt. Meine ist mit 24,4% jedoch deutlich darüber.
Meine Frage: Wäre ein solcher listenweiser Fallausschluss zulässig?
Es wäre natürlich schade so viele Fälle dadurch zu verlieren, dass die Probanden eventuell nur bei einer von 20-30 Fragen "keine Angabe" angegeben haben. Gibt es alternative Vorgehensweisen, um solche Probanden trotzdem sinnvoll in die logistische Regression zu integrieren?
Danke schon einmal für Eure Hilfe und viele Grüße!
Appello