Logit Transformation: Interpretation der Koeffizienten

Alle Verfahren der Regressionanalyse.

Logit Transformation: Interpretation der Koeffizienten

Beitragvon Markst » Fr 22. Sep 2017, 20:46

Hallo an Alle!

ich hänge gerade an der Datenanalyse meines "kleinen" ökonometrischen Projekts für die Uni (im Bachelor).
Kurz zum Thema:
Ich will den Einfluss von Globalisierung (gemessen als Index) und Ungleichheit (GINI-Index) auf Armut mittels OLS herausfinden. Das Modell ist ein (vermeintlich) einfaches cross country Modell mit 74 Staaten, wobei hochentwickelte Länder und OECD-Staaten ausgeschlossen sind. Armut, also meine abhängige Variable, ist hierbei die bekannte Headcount-Ratio der Weltbank, also der %-Anteil der Bevölkerung eines Staates, der unter 3.10$ am Tag lebt. Zusätzlich kommen ein paar Kontollvariablen dazu, wie zum Beispiel (1) Gesundheitsausgaben pro Kopf,
(2) Prozent der Bevölkerung, die eine ausgebaute und konstante Wasserquelle zur Verfügung haben, (3) Secondary Schoolenrollment (gross %) und noch weitere Indikatoren, die die Entwicklung eines Staates kausal bedingen könnten und auf die ich kontrollieren sollte (wobei mir bewusst ist, dass ich auf Multikollinearität achten muss).

Nun habe ich schon herausgefunden, dass wenn y (abhängige Variable) in % gemessen wird, ich offenbar nicht einfach untransformiert die kleinste Quadrate Methode OLS anwenden kann bzw. die Gauss-Markov-Theoreme verletzte (MLR1 Linearität und vermutlich auch MLR4 Normalverteilung der Residuen). Laut Google scheint eine logit-transformation der y-Variable eine gängige Methode zu sein, um dependant variables, die als proportions oder in Prozent gemessen sind, sinnvoll für eine OLS-Regression verwenden zu können.
Die Logit-transformation meiner ursprünglichen Abhängigen (=Poverty3$) habe ich in Stata ausgeführt mit dem Befehl: gen Pov3_logit = logit(Poverty3$ / 100)

Soweit so gut: Tatsächlich sehen nach der logit-transformation meiner Abhängigen (="Poverty3$") die Scatterplots zwischen Poverty3$_logit und manchen Regressoren deutlich "linearer" aus (bei anderen wiederum nicht, das heißt, da müsste ich auf jene, wo die Beziehung jetzt nicht mehr linear ist, auch wieder Transformationen anwenden :? ). Auch die Signifikanz der meisten Koeffizienten ist gestiegen. Manche sind durch diese Transformation überhaupt er deutlich signifikant geworden. Das war für mich erstmal Grund zu Freude.

Leider verstehe ich nun aber einfach nicht, wie ich die Koeffizienten interpretiere, also wie die klassische ceteris paribus-Beziehung funktioniert. Ich will ja nicht wissen, wie sich die Logit-Werte (die ich um ehrlich zu sein auch nicht verstehe) von Poverty3$ verändern, wenn sich Regressor x1 um 1% erhöht, sondern wie sich die Ausgangsvariable Poverty3$ (in %) verändert.
Ich habe dazu folgenden kurzen Beitrag gefunden, der das Prozedere der logit-Transformation beschreibt:
http://www.bmj.com/content/352/bmj.i1114
Ab dem Abschnitt "Back-transformation" wird beschrieben und dargstellt, wie ich meine Ergebnisse wieder interpretierbar bekomme. Ich verstehe es nur einfach nicht....

Vielleicht kann mir jemand einen schlauen Rat geben bzw. erklären, wie ich meine Ergebnisse sinnvoll interpretieren kann?
Bin ich vielleicht auf der falschen Fährte? Ich habe auch Beträge gelesen, die meinen, man könne auch einfach hinnehmen, dass die Ergebnisse "schlechter", also ungenauer ausfallen, wenn ich halt nicht logit-transformiere und gut ist. Aber das will ich eigentlich nicht, wenn ich doch weiß, dass es eigentlich besser geht.
Gibt es andere Heransgehensweisen an mein Modell? Ich habe auch von fractional- und von logit-Regressionen gelesen, wobei ich dachte, dass letzteres nur bei binär codierten abhängigen Variablen angewandt wird. Trotzdem scheint eine logit-regression und die logit-transformation ja irgendwie stark zusammenzuhängen. Beides hatte ich nur leider nicht im bisherigen Studium und ich merke beim Lesen der Literatur, dass mir dafür irgendwie das theoretische Rüstzeug fehlt, weshalb ich bei logit-transformation bleiben wollte – denn die erlaubt es mir, so wie ich es verstanden habe, im OLS-Verfahren zu bleiben.

Ich habe hier mal beispielhaft den Auswurf von Stata zur Regression der logit-transformierten Poverty-Variable zu Globalisierung (Index von 1 bis 100) und Health Expenditure per Capita angehängt.
Bild

Beides signifikant und mit dem nach Theorie zu erwartendem Vorzeichen (ganz grob: Globalisierung eines Landes bedeutet eine Verringerung der Armut. Ebenso mit Gesundheitsausgaben pro Kopf. Deshalb sind die Vorzeichen der Koeffizienten negativ.). Jedoch kann ich die Effekte so nicht quantifzieren, also keine Aussage der Form "Bei einem 1%-Increase der Globaliserung, ist mit einem Sinken der Armut im Ausmaß von x% zu rechnen" machen.

Ich hoffe, ich habe die Hardfacts meiner Arbeit und meines Problems soweit ausreichend zusammengefasst, sodass ihr anhand meiner Angaben die Chance habt, mir sinnvoll zu antworten.
Wenn zur Beurteilung meiner Lage Informationen fehlen, liefere ich sie nach!

Größten Dank schon mal
(den Part, dass ich verzweifelt bin, habe ich mir mal gespart...)
Markst
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 22. Sep 2017, 19:16
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Logit Transformation: Interpretation der Koeffizienten

Beitragvon Markst » Fr 22. Sep 2017, 20:47

EDIT: das mit dem Bild des Stata Outputs hat wohl nicht funktioniert. Hier wäre dann der Link zum Upload!
https://picload.org/view/dgalalgr/regre ... p.jpg.html
Markst
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 22. Sep 2017, 19:16
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Logit Transformation: Interpretation der Koeffizienten

Beitragvon PonderStibbons » Fr 22. Sep 2017, 22:09

Grundsätzlich ist bei n > 30 nicht mehr erforderlich, dass die Residuen aus einer normalverteilten Grundgesamtheit stammen, damit der statistische Signifikanztest zuverlässig bleibt (zentraler Grenzwertsatz).
Laut Google scheint eine logit-transformation

Google gibt Statistiktipps?

Transformieren sollte man in erster Linie aus sachlichen, inhaltlichen guten Gründen. Gibt es in der Literatur zu dem Thema Hinweise darauf, dass eine logit-transformierte Variable den Sachverhalt Armut besser abbildet als die untransformierte Variable?

Und zunächst mal sollte eine Inspektion erfolgen, wie die Prozentwerte sich denn überhaupt in der Stichprobe verteilen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Markst

Re: Logit Transformation: Interpretation der Koeffizienten

Beitragvon Markst » Sa 23. Sep 2017, 16:08

Danke schon mal für die Antwort.

ich habe es so verstanden, dass es nun ökonometrische Notwendigkeit ist, eine Abhängige, die in Prozent oder als Proportion angegeben ist, für OLS zu transformieren. In der Literatur habe ich dazu aber tatsächlich nichts gefunden, habe jedoch den Hinweis von einem Kommilitonen bekommen und darauf im Internet recherchiert. Die Foren und Paper, die ich dann dazu gefunden habe, haben das dann schon irgendwie bestätigt. Zumindest scheint es ja üblich zu sein.

Zur Verteilung der Stichprobe:
Rund 1/4 der Beobachtungen bewegen sich im 0 bis 20%- Bereich. 20 der 74 Staaten, also ca 1/3 der Stichprobe haben Werte von unter 5%. Hingegen haben nur wenige Staaten einen Anteil von mehr als 80% der Bevölkerung, die mit unter 3$ leben. Hier die summary statistic:

Variable | Obs | Mean | Std.Dev. | Min | Max
----------------------------------------------------------------------------------------------
Povert3§ | 74 | 32.524 | 29.6405 | 0.07 | 90.7


Würdest du nun vorschlagen, dass wenn ich in der Literatur zu meinem Thema nichts von einer logit-Transformation gelesen habe, ich diese auch einfach sein lassen soll?

Danke und beste Grüße
Markst
Markst
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 22. Sep 2017, 19:16
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 17 Gäste

cron