Hallo zusammen,
ich bräuchte dringend kompetenten Rat!
Derzeit führe ich eine einfache lineare Regression durch, um separten Überblick über die Zusammenhänge zwischen der abhängigen und den unabhängigen Variablen zu erhalten.
Dazu verwende ich R.
Nun bin ich bei dem Thema "Regressionsdiagnostik" gelandet und musste anhand der Plots feststellen, dass im Plot "Residuals vs Fitted" eine Trichterform (also Heteroskedastizität), die sich nach hinten öffnet, vorliegt und ebenfalls die Linie nicht gerade ist (also Linear) sondern einen kleinen Bogen nach unten macht. Die Residue sind annährend normalverteilt (nur am hinteren Ende weichen die Werte von der "QQLine" ab). Nun habe ich etwa die halbe Nacht nach Möglichkeiten gesucht, wie man Heteroskedastizität entgegenwirken kann. Dabei bin ich auf die Robusten Regression gestoßen. Ich habe gesehen, dass sich die Standardfehler sowie t und p-Werte somit neu berechnen lassen und das unter:
Test1 <- vcocHC(DataFrame, type="HC3")
coeftest(DataFrame, vcov=Test1)
Somit bekomme ich wieder gültige t und p-Werte sowie einen höheren Standardfehler. Nun einige Frage:
1. Was bedeutet dieses HC3?
2. Ändert sich NUR der Standardfehler, p und t Wert? Wie interpretiere ich das nun - bleibt das R² und die Steigung erhalten nur der t und p Wert sowie der Standardfehler müssen im Vergleich zur "alten" Interpretation ersetzt werden?
3. Was ist mit der Verletzung, dass die Residuen nicht linear sind?
4. Gibt es noch einfachere/bessere Möglichkeiten?
Noch eine kleine Anmerkung: die abhängige Variable lässt sich nicht normalverteilen.
Ich freue mich riesig über Hilfe und neue Ratschläge und bedanke mich schon herzlich im Voraus!!!
Liebe Grüße