lineare Regression unabhängige Variablen logarithmieren

Alle Verfahren der Regressionanalyse.

lineare Regression unabhängige Variablen logarithmieren

Beitragvon Rico34 » So 10. Nov 2013, 11:51

Hallo,
ich teste in meiner Arbeit, mithilfe der linearen Regression, ob bestimmte Variablen einen signifikanten Einfluss (Irrtumswahrscheinlichkeit 10 %) auf die abhängige Variable haben. Ich habe bei den unabhängigen Variablen, Variablen mit prozentualen Anteilen (wie z.B. Anteil Frauen) aber auch Variablen wie Einkommen und Bevölkerungsdichte. Jetzt hatte ich in ein paar Artikeln gelesen, dass man Variablen wie Einkommen und Bevölkerungsdichte logarithmieren sollte bevor man diese mit der linearen Regression berechnet, mit der Begründung das es nicht so eine große Streuung geben würde.
Mein Problem ist dann aber, dass sich durch das logarithmieren die Signifikanzen einiger Variablen ändern, so das Variablen die vorher als signifikant angezeigt wurden jetzt nicht mehr signifikant und umgedreht Variablen, die vorher nicht signifikant waren jetzt signifikant sind. Ich weiß jetzt aber nicht welchen Ergebnissen ich mehr Glauben schenken soll. Wäre deswegen an eurer Meinung zu dem Problem interessiert.
Vielen Dank für eure Hilfe im voraus.
Rico34
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: So 10. Nov 2013, 11:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon DHA3000 » Di 12. Nov 2013, 11:02

Erst einmal ist das kein "Problem", sondern ein Ergebnis. Oder versuchst du möglichst irgendwie alle Variablen signifikant zu bekommen?
Das ist nicht der Sinn von Statistik/Ökonometrie! ;)

Logs ergeben eigentlich immer Sinn, wenn Werte der Variablen nicht negativ werden kann. Ansonten korrigierst du auch ein wenig für einen exponentiellen Anstieg in den Daten.
Welches Modell das bessere ist, kann du über das adjustierte R², die Informationskritieren oder Likelihood-Ratio-Tests sehen.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon Holgonaut » Di 12. Nov 2013, 11:14

Hi,

@DHA: Die Debatte, ob man UVs logarithmieren sollen haben wir schon ewig in der Abteilung. Kannst du mir sagen, was der Grund dafür sein soll? Eine Quelle wäre auch schön.
Mich verwirrte diese Praxis etwas. Eine schiefverteilte UV widerspricht ja nicht den Annahmen der Regression. Warum dann was künstlich ändern? Wenn dann was anderes herauskommt, widerspricht das m.E.
der Logarithmierung. Aber ich lass mich gern vom Gegenteil überzeugen....

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon DHA3000 » Mi 13. Nov 2013, 01:05

Ouh, das mit den Logs bezog sich eher allgemein. Aber ja, es gibt von Lütkepohl und Xu zum Forecasting einen Paper. Wobei dies natürlich Zeitreihenanalyse ist.
http://ideas.repec.org/p/ces/ceswps/_2591.html

Im Grunde genommen hat der/die TO schon recht mit der Stabilisierung (der Varianz) . Allerdings gilt dies eher, wenn ich wirklich aus meinen Daten einen Forecast generiere und diesen einem Benchmark gegenüberstelle.
Ob dies in diesem Fall Vorteile birgt, würd sich - wenn - in den Informationskriterien wiederschlagen.

Ich würde aber allgemein bei AV sagen, dass es kein Richtig oder Falsch gibt und man alles entsprechend begründen kann.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon Rico34 » Mi 13. Nov 2013, 11:24

Danke für die Hilfe.

Nein, ich versuche nicht alle Variablen signifkant zu bekommen. Ich möchte nur herausbekommen, da es mit und ohne log für bestimmte unabhängige Variablen unterschiedliche Ergebnisse gibt, welches das bessere Modell ist.

Hier mal meine Ergebnisse:

Modell (ohne logs):
korrigierte R²: 0,687
Akaike-Kriterium: -651, 72
Schwarz-Kriterium: -602,22

Modell (mit logs):
korrigierte R²: 0,680
Akaike-Kriterium: -648, 42
Schwarz-Kriterium: -598,92
Rico34
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: So 10. Nov 2013, 11:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon DHA3000 » Do 14. Nov 2013, 11:45

Hmm, die Ergebnisse, gepaart mit der wechselnden Signifikanz, weisen auf eine geringe Stichprobe hin, kann das sein?
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon Rico34 » Do 14. Nov 2013, 15:52

n = 169 in der Stichprobe, dies liegt daran, dass die Messung für ein geografisches Gebiet ist, welches 169 Untergebiete enthält.
Die Anzahl der unabhängigen Variablen ist 15.
Rico34
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: So 10. Nov 2013, 11:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon DHA3000 » Sa 16. Nov 2013, 15:10

Hmm, was passiert, wenn du dir Auswahl der erklärenden Variablen variierst? Moment könnten die Ergebnisse auch durch Multikollinearität verursucht werden.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon Rico34 » Sa 16. Nov 2013, 15:40

Multikolliniarität hatte ich getestet mit VIF und die Werte lagen alle unter 10.
Bei einer Varition der erklärenden Var. gibt es veränderungen, die sind aber meist nur sehr gering. Ich soll die erklärenden Variablen aber im großen und ganzen so verwenden/ testen.
Rico34
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: So 10. Nov 2013, 11:47
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: lineare Regression unabhängige Variablen logarithmieren

Beitragvon DHA3000 » Sa 16. Nov 2013, 17:14

Ja, der VIF ist immer so eine Sache - vor allem wenn man viele erklärende Variablen hat. Ab >5 kann man da schon keine sicheren Rückschlüsse ziehen.
Wesentlich sinnvoller ist es, wenn man sich einmal die Korrelationsmatrix anschaut und bspw. eine der beiden Variablen mit >0.7-0.8 einmal weglässt.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

folgende User möchten sich bei DHA3000 bedanken:
Rico34

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste