Hallo zusammen!
Ich sitze nun schon seit 2 Tagen an einem Problem und komme beim besten Willen nicht weiter!!! Darum habe ich mich entschlossen mich hier zu registrieren und hoffe, dass sich jemand findet, der mir etwas weiter helfen kann!
Ich habe ein lineares Regressionsmodell (also: Y= beta0+beta1*X1+beta2*X2) und meine Regressoren X1 und X2 weisen eine Korrelation von ungefähr 0,7 auf. Ich habe eine sogenannte Condition Number berechnet ( CN= 1/(1-r²) ) die, weil sie größer ist als 10 (nämlich über 300!!!) auf Multikollinearität hindeutet. Bekanntlich führt das ja dazu, dass geschätzten Regressionskoeffizienten instabil sind. Umgehen kann man das mit der Ridge Regression. Die Betas werden hier folgendermaßen ermittelt:
Beta = (X'X+KI)^(-1)X'y . Soweit so gut.
Ich möchte K schrittweise von 0-0.1 variieren lassen und dann das K wählen, bei dem die CN unter die Schwelle 10 fällt. Hier nochmal der englische Text zu dieser Idee.
****
estimate the coefficients by using ridge regression only when the condition number is above a specific threshold (e.g. 10). The size of the ridge constant is chosen using aniterative searching procedure 3 that finds the lowest positive number, k, which makes the recomputed condition number fall below the threshold.
By adding a small bias, the correlation between the regressors will decrease and so will the condition number.
****
Mein Problem ist aber, wenn ich nun meine neuen Betas alle berechne, hat das doch keinen Einfluss auf meine Regressoren!? Die bleiben doch so wie zu Beginn auch?! Warum sollte dann die CN und damit die Korrelation geringer werden?! Oder muss ich auf Grundlage der neuen Betas meine Regressoren berechnen (Falls ja, wie?!) ?!
Ich bitte wirklich um Hilfe, weil ich schon langsam an verzweifeln bin. Ich weiß nicht wo mein Denkfehler ist!
Danke im Voraus und viele Grüße
Naseweiß