nicht-normalverteilte Residuen besagen, dass das lineare Modell nicht gut zu Deinen Daten passt. Alle Aussagen, die Du aus dem linearen Modell ableitest sind nur so gut, wie die Daten zum Modell passen. Was das in Deinem konkreten Fall bedeutet kann nur sagen, wer Deinen konkreten Fall kennt.
amelie94 hat geschrieben:1. Kann ich dies einfach über den Befehl shapiro.test() testen ? bzw. für den fall 1+2: shapiro.test(lm(formula = w3 ~ z)$resid)
(wobei der P-Wert möglichst größer sein sollte, als das Signifikanzniveau)
Der Shapiro-Test kann helfen, ist aber für sich allein genommen zu wenig für eine wohl-abgewogene Entscheidung. Der Test wird halt bei ganz kleinen Datensätzen nicht positiv und bei großen wegen geringster Abweichungen von der Normalität. Die Wichtigkeit der Normalität von Residuen geht aber genau anders herum: je kleiner n, umso wichtiger.
Besser ist oft eine graphische Kontrolle mit einem Quantile-Quantile-Plot, z. B.
- Code: Alles auswählen
w3<- c( 17484.0, 18225.0, 19023.0, 19137.0, 20704.5, 23209.5, 27904.5, 36397.5, 49848.0,
34053.0, 33571.5, 32773.5, 36606.0, 38230.5, 40564.5, 40383.0, 38601.0)
z <- c(3.9, 3.9, 3.9, 3.9, 3.9, 4.6, 5.3, 6.1, 7.4, 6.9, 6.4, 6.6, 6.7, 6.8, 7.5, 8.2, 8.7)
re <- lm(w3~z)$residuals
qqnorm(re)
qqline(re)
(Hinweis: nach Quantile-Quantile-Plots googlen, damit der Plot sich erschließt. Datenpunkte 9 und 17 fallen aus der Reihe.)
Reden wir immer noch von w3 und z aus Deinem Eingangsbeispiel? Ist Dir folgendes aufgefallen?
- Code: Alles auswählen
> shapiro.test(lm(log(w3)~log(z))$residuals)
Shapiro-Wilk normality test
data: lm(log(w3) ~ log(z))$residuals
W = 0.96562, p-value = 0.7381
LG,
Bernhard