Hallo zusammen!
Ich schreibe gerade meine Bachelorarbeit und es geht um eine binäre logistische Regressionsanalyse, wobei ich zurzeit an der Modellauswahl bastle, bevor ich dann analysiere. Folgende Ausgangslage:
-> meine Zielvariable ist wie gesagt 0-1-codiert (binär)
-> meine Prädiktoren:
- einer ist auch binär codiert
- alle restlichen sind ordinalskaliert im Bereich 0,1,2,3,4,5 mit den Stufen "0: trifft garnicht zu => 5:trifft voll zu" bzw. "0: sehr wenig/sehr gering => 5: sehr stark/hoch" .
Ich würde nun gerne ohne Dummyvariablen analysieren, da ich ja sonst 31 Prädiktoren erhalten würde, d.h. ich würde die 5 letztgenannten Variablen gerne als quasi-intervallskaliert betrachten, wie es ja in der Forschungspraxis oft gemacht wird.
Dies rechtfertige ich in der Arbeit mit diesem Absatz:
"Sehr wichtig ist zudem die Behandlung der ordinalskalierten Prädiktoren mit den geordneten, zunehmenden Ausprägungen mit der Codierung 0 bis 5. Im weiteren Verlauf der Datenauswertung sollen diese, wie in der Forschungspraxis sehr verbreitet, als quasi-intervallskalierte Prädiktoren behandelt werden. Als Begründung ist zum einen die bei Ordinalskalierung im Allgemeinen nicht gewährleistete Äquidistanz zwischen den einzelnen Ausprägungen zu nennen, die sich in unserem Falle jedoch sowohl numerisch als auch interpretativ auf Seiten der Probanden nachvollziehen lasst, da lediglich die geringste und höchste Ausprägung eine Bezeichnung aufweist (0: trifft garnicht zu und 5: trifft voll zu) und die Skala leicht als Intervall mit äquidistanten Abstufungen zwischen den Extrema interpretierbar ist (vgl. Litz: S. 149). Ferner bietet die Vielzahl an Ausprägungen eine Bandbreite an unterschiedlichen Realisationen und somit eine diskrete Approximierung eines stetigen Intervalls für die Angaben der Probanden (vgl. Clason/Dormody: S. 32)."
Gibt es zu dieser Begründung Einwände bzw. wie kann ich überprüfen, ob ich hier vernünftige Werte erhalte?
Vielen Dank schonmal für eure Hilfe,
Stefan