mein Regressionsmodell bezeichne man mit osi.lm:
> osi.lm = lm( ... ) /* Mein lineares Regressionsmodell */
Ich habe eine Frage zur Normalverteilungsannahme/-überprüfung der Residuen in der linearen Regression. Was ist unten konkret der Unterschied?
Gefunden habe ich Variante 1:
- Code: Alles auswählen
> osi.res = resid(osi.lm)
> hist(osi.res)
> qqnorm(osi.res)
> qqline(osi.res)
> shapiro.test(osi.res)
Shapiro-Wilk normality test
data: osi.res
W = 0.9805, p-value = 0.008547
Zu Variante 1 die Screenshots:
Histogramm osi.res

QQ-Norm-Plot osi.res

Variante 2:
- Code: Alles auswählen
> osi.stdres = rstandard(osi.lm)
> hist(osi.stdres)
> qqnorm(osi.stdres)
> qqline(osi.stdres)
> shapiro.test(osi.stdres)
Shapiro-Wilk normality test
data: osi.stdres
W = 0.9803, p-value = 0.007966
Hist osi.stdres

QQ-Norm-Plot osi.stdres

Meine Fragen:
a) Was sind die Unterschiede in den beiden Varianten?
b) Woher sehe ich konkret im Normal Q-Q-Plot, dass keine Normalverteilung vorliegt?
c) Kann ich die lineare Regression vergessen, weil die Residuen eben nicht normalverteilt sind? Der Shapiro-Wilk normality test widerlegt ja, dass eine Normalverteilung angenommen werden kann...
Danke für eure Antworten.
Grüße
fenomen