Formulierung der Regressionsgleichung

Alle Verfahren der Regressionanalyse.

Formulierung der Regressionsgleichung

Beitragvon Pia* » Fr 16. Jun 2017, 17:43

Guten Tag,

ich möchte die Signifikanz von Bildung auf das Wirtschaftswachstum in Deutschland testen. Im Speziellen möchte ich wissen, ob bessere Bildungswerte zu einem höheren Wirtschaftswachstum in den jeweiligen Bundesland führt. Dafür habe ich Daten des BIP pro Kopf in jeweiligen Preisen für die Jahre 2004-2015 für die deutschen Bundesländer, sowie Veränderung in % zum Vorjahr zur Verfügung. Außerdem habe ich aus einer externen Quelle externe Bildungswerte für 2004-2015. Diese Bildungswerte bestehen aus Punktwerten von 1-100, wobei 100 den bestmöglichen Wert darstellt.

Mir ist nicht ganz klar, wie ich die Regression aufstellen soll. Wenn ich als abhängige Variable bspw. BIP pro Kopf für Sachsen wähle, bleibt mir für die erklärende Variable lediglich der Bildungswert für Sachsen. Der in dieser Regression insignikant ist. Alternativ würde ich wählen: BIP pro Kopf für Deutschland als y und x1 Bildungswert Sachsen, x2 Bildungswert Berlin, etc. Könnte das zu einer aussagekräftigen Regression führen? Da mein Professor für die Beantwortung der Frage auch Interaktionsterme fordert, müsste ich die zweite Regressionsvariante wählen, da der einzige Interaktionsterm den ich mich vorstellen könnte, wäre: BIP pro Kopf für (bspw.) Sachsen *BildungswertSachsen. Ich bin mir aber hier auch unsicher, ob dann nicht Bip pro Kopf für das jeweilige Bundesland mit dem y Wert korreliert wäre und somit ein Fehler entstehen würde.

Vielen Dank im Voraus.

Viele Grüße
Pia
Pia*
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 16. Jun 2017, 17:18
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Formulierung der Regressionsgleichung

Beitragvon PonderStibbons » Fr 16. Jun 2017, 18:07

ich möchte die Signifikanz von Bildung auf das Wirtschaftswachstum in Deutschland testen.

"Zusammenhang zwischen Bildung und Wachstum" ist vermutlich gemeint?
Im Speziellen möchte ich wissen, ob bessere Bildungswerte zu einem höheren Wirtschaftswachstum in den jeweiligen Bundesland führt.

Die kausale Sprache würde ich sehr viel vorsichtiger verwenden. Korrelative Zusammenhänge wird man nachweisen können, Ursache-Wirkung-Beziehungen wohl kaum. Beispielsweise können Bildung und Wachstum gleichermaßen durch einen Drittfaktor verursacht sein, was zu einer Scheinkorrelation führen würde.
Alternativ würde ich wählen: BIP pro Kopf für Deutschland als y und x1 Bildungswert Sachsen, x2 Bildungswert Berlin, etc. Könnte das zu einer aussagekräftigen Regression führen?

Keine Ahnung. Verstehe die Idee nicht.
Da mein Professor für die Beantwortung der Frage auch Interaktionsterme fordert,

Wozwischen fordert er Interaktonstherme?

Was man wohl am ehesten rechnen müsste, wäre ein Mehrebenenmodell. Kennst Du sowas? Weniger elegant, aber möglich wäre eine Kovarianzanalyse bzw. eine dem äquivalente multiple Regression (u.a. mit dummy-codierten kategorialen Prädiktoren). Hierbei würden die 16 (Länder) x 15 (Jahre) = 240 Bildungswerte zur Vorhersage der 240 BIP-Werte herangezogen; da die Daten geclustert sind (je 15 Wertepaare gehören immer zu einem Bundesland), müsste man den 16stufigen Faktor "Bundesland" und die 16 Interaktionen zwischen Bundesland und Bildung mit einbeziehen.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Pia*

Re: Formulierung der Regressionsgleichung

Beitragvon DHA3000 » Sa 17. Jun 2017, 17:25

Fixed Effects Panel Regression ist wohl das Modell der Wahl.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

folgende User möchten sich bei DHA3000 bedanken:
Pia*

Re: Formulierung der Regressionsgleichung

Beitragvon Pia* » Sa 17. Jun 2017, 18:20

Ich arbeite bisher nur mit Excel, da ich für STATA nebenbei noch eine do-file anlegen müsste. Da sich bei meinen Arbeiten mit do-files des Öfteren zeitaufwendige Syntaxfehler eingeschlichen haben, wollte ich das auch vermeiden zu STATA zu wechseln. Ich bin mir natürlich jetzt nicht mehr sicher, ob sich diese Verfahren überhaupt mit Excel berechnen lassen.

Meine statistischen Kenntnisse sind nicht die Besten. Mit dem Fixed Effects Modell hatte ich mich schon mal kurz beschäftigt, das Mehrebenenmodell kannte ich vorher leider nicht. Hab ich da aber heute reingelesen. Leider ist mir das Vorgehen noch völlig unklar.

Viele Grüße
Pia
Pia*
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 16. Jun 2017, 17:18
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Formulierung der Regressionsgleichung

Beitragvon PonderStibbons » Sa 17. Jun 2017, 19:23

Wenn's nicht mehr als Excel sein darf, kannst Du auch für jedes Bundesland eine Korrelation zwischen Bildung und BIP über die Zeit rechnen und diese 16 Koeffizienten deskriptivstatistisch darstellen (Minimum, Maximum, Median).

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Pia*

Re: Formulierung der Regressionsgleichung

Beitragvon Pia* » Sa 17. Jun 2017, 19:57

Da die Regression zur Prüfungsleistung gehört werde ich wohl das Programm wechseln müssen, wenn Excel nicht ausreicht.

Viele Grüße
Pia
Pia*
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 16. Jun 2017, 17:18
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Formulierung der Regressionsgleichung

Beitragvon Pia* » Mi 21. Jun 2017, 13:28

Hallo,

ich hab mich in das Modell soweit eingelesen und das Fixed-Effects-Modell mit Stata geschätzt. Kann ich jetzt anhand des Modells interpretieren, ob bei einem besseren Bildungsstand automatisch ein höheres BIP erzielt wird oder sind das nur Mittelwert angaben und ich kann das nicht speziell auf ein Bundesland beziehen?

Vielen Dank in Voraus.

Viele Grüße
Pia*
Pia*
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 16. Jun 2017, 17:18
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Formulierung der Regressionsgleichung

Beitragvon Pia* » Mi 21. Jun 2017, 14:44

Ich bin mir auch zudem nicht sicher, welche Regression sinnvoller ist. Eine mit x nur für Bildung oder ein mit Bildung und Interaktionsterm zwischen Bildung*BIPproKopf. Eigentlich würde ich die mit Interaktionsterm bevorzugen, jedoch ist hier der Bildungswert negativ und das hilft mir bei der Interpretation nicht. Was sagt der Interaktionsterm in diesem Zusammenhang eig. genau aus und welche Regression würdet ihr sinnvoller finden?


_1. Regression__________________________________________________________________
Fixed-effects (within) regression Number of obs = 144
Group variable: nr Number of groups = 16

R-sq: Obs per group:
within = 0.8727 min = 9
between = 0.9630 avg = 9.0
overall = 0.8643 max = 9

F(2,126) = 431.76
corr(u_i, Xb) = 0.8251 Prob > F = 0.0000


BIPproKopf Coef. Std. Err. t P>t [95% Conf. Interval]

Bildung -51.24867 24.00336 -2.14 0.035 -98.75062 -3.746725
Interaktion .0058952 .0005811 10.15 0.000 .0047452 .0070451
_cons 22349.04 523.7185 42.67 0.000 21312.62 23385.46

sigma_u 5926.6405
sigma_e 748.96672
rho .98428093 (fraction of variance due to u_i)

F test that all u_i=0: F(15, 126) = 27.22 Prob > F = 0.0000

__2. Regression______________________________________________________________________________
Fixed-effects (within) regression Number of obs = 144
Group variable: nr Number of groups = 16

R-sq: Obs per group:
within = 0.7687 min = 9
between = 0.0026 avg = 9.0
overall = 0.0201 max = 9

F(1,127) = 421.96
corr(u_i, Xb) = -0.0785 Prob > F = 0.0000

BIPproKopf Coef. Std. Err. t P>t [95% Conf. Interval]

Bildung 182.8009 8.899064 20.54 0.000 165.1913 200.4106
_cons 18985.84 544.3442 34.88 0.000 17908.68 20063

sigma_u 9180.7128
sigma_e 1005.5571
rho .98814554 (fraction of variance due to u_i)

F test that all u_i=0: F(15, 127) = 745.58 Prob > F = 0.0000
_______________________________________________________________________________

Vielen Dank im Voraus.

Viele Grüße
Pia*
Pia*
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 16. Jun 2017, 17:18
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste

cron