Hallo liebes Forum,
mir geht es um die Normalverteilung der Residuen (bei N=212).
In dem Buch (Angewandte Regressionsanalyse: Theorie, Technik und Praxis) von Urban und Majer steht Folgendes:
"Eine empirische Überprüfung der A5-Annahme (Normalverteilung) ist vor allem dann angezeigt, wenn [...] c) wenn sich hinsichtlich der empirischen Verteilung einer Y-Variablen aufgrund theoretischer Überlegungen oder praktischer Erfahrungen vermuten lässt, dass die Normalverteilungsannahme bei Analyse dieser Variablen gefährdet sein könnte. So weist beispielsweise das Nettoeinkommen in aller Regel eine rechtsschiefe Verteilung auf . Und die gemessene Lebenszufriedenheit zeigt fast immer eine linksschiefe Verteilung. In solchen Fällen geschieht es nicht selten, dass bei Berücksichtigung dieser Variablen in Regressionsschätzungen empirische Residuenverteilungen entstehen, die vom Ideal einer Normalverteilung stark abweichen . Allerdings muss das nicht so sein, und auch eine sehr schief verteilte Y-Variable kann für eine inferenzstatistisch durchgeführte Regressionsanalyse vollkommen ohne Bedeutung sein . Denn die A5 (Normalverteilungsannahme) bezieht sich allein auf die Residuenverteilung und nicht auf die empirische Verteilung der Y-Variablen einer Regressionsanalyse."
Nun ist es bei mir so, dass meine Y-Variable rechtsschief ist (Abbruchintensität bezogen auf einen Studienabbruch). (M=1,79, SD=1,07, bei einer Antwortskala von 1 bis 7). In zwei anderen Studien war die Verteilung dieser Variable in der Stichprobe auch eher rechtsschief. Meine Betreuerin gab mir die Info, dass dies eine übliche Verteilung für diese Variable ist. Wäre das eine Gefährdung der Normalverteilung bei der Analyse der Variablen (wie es im Zitat angesprochen wird)? Dann würde ich ja Gegenmaßnahmen ergreifen müssen. Ich dachte da an Bootstrap.
In meiner Regression weicht tatsächlich die Residuenverteilung von der Normalverteilung ab. Nun bin ich mir nicht sicher, ob ich mich auf den zentralen Grenzwertsatz berufen kann (anhand meiner Stichprobengröße wäre dies ja möglich) oder von einer Verletzten Normalverteilung (wegen der Grundgesamtheit) ausgehen muss.
Oder kann es sein, dass meine Überlegungen nicht ganz plausibel sind bzw. ich das nicht richtig verstanden habe?
Über eine erfahrene Einschätzung wäre ich sehr dankbar
Viele Grüße
Clet