Hallo zusammen, ich bräuchte nochmal eure Hilfe.
Folgende Thematik:
Ich möchte im Rahmen einer multiplen, linearen Regressionsanalyse den Zusammenhang zwischen ca. 30 UV und einer AV untersuchen.
Die unabhängigen Variablen besitzen durchgängig jeweils 4 Skalenpunkte (1,2,3,4), für die Äquidistanz und Intervallskalierung angenommen wird. Zusätzlich gibt es noch die Antwortkategorie "weiß nicht".
Die AV besitzt 7 Skalenpunkte, Äquidistanz und Intervallskalierung wird ebenfalls angenommen.
Welchen Ansatz würdet ihr empfehlen, um die UV in das Regressionsmodell aufzunehmen?
Mein Problem besteht darin, dass durch die zusätzliche Antwortkategorie "weiß nicht" meine eigentlich intervallskalierten UV dadurch Nominalskalenniveau erreichen und ich somit mit Dummy-Variablen arbeiten müsste, oder sehe ich das falsch? Dadurch würden aus den 30 Variablen allerdings 120 Dummy-Variablen, wenn ich das richtig verstanden haben.
Alternativ könnte man die Antworten der "weiß nicht" - Kategorie als fehlende Werte definieren, allerdings würd sich dann, zumindest bei einem listenweisen Ausschluss, die Stichprobe deutlich reduzieren, da nur noch Fälle übrig bleiben, die für keine der 30 UV die Kategorie "weiß nicht" angeklickt haben.
Wie würdet ihr mit diesem Problem umgehen?