Also wenn ich richtig verstehe, ist die gewichtete Regression eine Regression mit robusten Standardfehlern und keine robuste Regression? Da mich aber momentan nicht die Ausreißer beschäftigen sondern die heteroskedastischen Fehlervarianzen, bin ich bei der gewichteten Regression richtig.
Bei der Residuenanalyse meines Modells, genauer gesagt beim Anschauen der Grafik von standardisierten Residuen gegen die gefitteten Werte, kann ich einen eindeutigen Trend beobachten. Das heißt doch, dass die Störgrößenvarianz nicht homogen ist. Nun fürhre ich den Breusch-Pagan-Test [bptest(mymdl)] für mein Modell durch. Der p-Wert von 2e-16 bestätigt mir meine Vermutung. Nur weiß ich leider nicht, welche Regressoren diese Heteroskedastizität im gesamten Modell hervorrufen. Kann man das irgendwie rausbekommen?
Ist es sinnvoll, den bptest für einzene Variablen durchzuführen? Bleibt dann die Aussage über den Variableneinfluss in einzelnen Tests für das gesamte Modell erhalten?
Danach führe ich die gewichtete Regression nach Fahrmeir durch mit einer zweistufigen Schätzung von Gewichten, und zwar "manuell", d. h. nach den Formeln. Dafür muss ich für die bekommenen Residuen eine Regression mit denselben Regressoren durchführen.
- Code: Alles auswählen
mymdl_ungew<-lm(Y~X1+X2+...,data=df)
res<-log((residuals(mymdl_ungew))^2)
test<-lm(res~X1+X2+...,data=df)
gew<-(1/exp(fitted(test)))
mymdl_gew<-lm(Y~X1+X2+...,data=df,weights=gew)
Nun zeigt mir die Grafik "Scale Location" [sqrt(rstandard) vs. fitted] keinen Trend mehr und ich kann zunächst davon ausgehen, dass meine Störgrößen nun homoskedastisch sind. Der bptest ist aufgrund seiner Konstruktion hier nicht mehr möglich, denn er testet nach wie vor das ursprüngliche Modell.
Ein im ungewichteten Modell signifikante Variable wird im gewichteten Modell plötzlich nicht mehr signifikant. Ist es normal? Heißt es, ich soll/kann sie aus dem Modell entfernen?
Soll man die zweite Regression der Residuen bzw. Residuen dieser Regression auch analysieren?[/b]