mein Regressionsmodell bezeichne man mit osi.lm:
> osi.lm = lm( ... ) /* Mein lineares Regressionsmodell */
Ich habe eine Frage zur Normalverteilungsannahme/-überprüfung der Residuen in der linearen Regression. Was ist unten konkret der Unterschied?
Gefunden habe ich Variante 1:
- Code: Alles auswählen
> osi.res = resid(osi.lm)
> hist(osi.res)
> qqnorm(osi.res)
> qqline(osi.res)
> shapiro.test(osi.res)
Shapiro-Wilk normality test
data: osi.res
W = 0.9805, p-value = 0.008547
Zu Variante 1 die Screenshots:
Histogramm osi.res
data:image/s3,"s3://crabby-images/bb947/bb947a73aa2e1f109c5a01718f7a7076468fcae2" alt="Bild"
QQ-Norm-Plot osi.res
data:image/s3,"s3://crabby-images/1fbef/1fbefe0cb685eba73e2d68ee0676653b4fe116df" alt="Bild"
Variante 2:
- Code: Alles auswählen
> osi.stdres = rstandard(osi.lm)
> hist(osi.stdres)
> qqnorm(osi.stdres)
> qqline(osi.stdres)
> shapiro.test(osi.stdres)
Shapiro-Wilk normality test
data: osi.stdres
W = 0.9803, p-value = 0.007966
Hist osi.stdres
data:image/s3,"s3://crabby-images/db952/db952a6bb7d68cf0824d7502a435c8a017da18fa" alt="Bild"
QQ-Norm-Plot osi.stdres
data:image/s3,"s3://crabby-images/ede06/ede06dcf441ed0716bd1e92d0ab992a07ccf0e18" alt="Bild"
Meine Fragen:
a) Was sind die Unterschiede in den beiden Varianten?
b) Woher sehe ich konkret im Normal Q-Q-Plot, dass keine Normalverteilung vorliegt?
c) Kann ich die lineare Regression vergessen, weil die Residuen eben nicht normalverteilt sind? Der Shapiro-Wilk normality test widerlegt ja, dass eine Normalverteilung angenommen werden kann...
Danke für eure Antworten.
Grüße
fenomen