Hallo zusammen,
ich möchte eine multiple lineare Regression durchführen. Meine AV hat folgende Häufigkeitsverteilung (n=125):
Die AV wurde als reflektives Konstrukt mit 4 Likert-Scale Items (Werte von 1 bis 5) gebildet über die der Mittelwert berechnet wurde (üblich bei mir). Die Peaks sind so zu erklären, dass einige Respondents alle 4 Likert-Scale Items gleich gekreuzt haben.
Laut Annahmen der multiplen linearen Regression (OLS) müssen meines Wissens nach die Residuen normalverteilt sein, nicht die AV. Das ist m.E. der Fall. PP-Chart und QQ-Chart sehen gut aus (nicht mit angehangen) und Shapiro-Wilk Test auf die standardisierten Residuen ist nicht signifikant.
Um auf Heteroskedastizität zu testen, habe ich die standardisierten Residuen gegen standardisierten geschätzten Werte geplotted.
Man erkennt drei parallele Linien. Diese sind m.E. auf die Peaks in der AV zurückzuführen. Diese scheinen eher "normal" zu sein und bei kleineren Samples aufzufallen. Eine Erklärung siehe z.B. hier: https://stats.stackexchange.com/questio ... 690#132690 oder hier: Searle, S. R. (1988). Parallel lines in residual plots. The American Statistician, 42(3), 211-211.
Sieht jemand bezüglich dieser Daten ein Problem eine multiple lineare Regression durchzuführen? Die anderen Annahmen der multiplen linearen Regression (OLS) habe ich ebenfalls getestet und keine besonderen Auffälligkeiten gefunden.
Danke und Grüße