Hallo an alle,
ich beschäftige mich derzeit zwecks meiner Abschlussarbeit mit einer Panelregression, "leider" nur mit einem Grundverständnis für Statistik und kaum ökonometrischer Vorbildung. Sofern hat alles auch gut geklappt, nur stecke ich nun etwas fest und bin mir sicher, dass ich hier auf kompetente Hilfe treffen kann.
Um es kurz zu fassen: ich untersuche die Auswirkung von CSR auf das Unternehmensrisiko. Hierzu habe ich Paneldaten erhoben ("unbalanced", d.h. ich habe zu etwa 25 Unternehmen Beobachtungen von je 2-4 Jahren, je nach Verfügbarkeit); insgesamt sind es etwa 90 Beobachtungen (etwa 2-4 pro Unternehmen). Ich habe nun ein Regressionsmodell konstruiert, grob nach der Form RISK=a+b1(CSR)+b2(ROA)+b3.... Was ab b2 folgt sind praktisch Kontrollvariablen.
Ich habe das Ganze zunächst mit OLS approximiert, glücklicherweise auch mit erfreulichen signifikanten Ergebnissen. Ich habe nach Jahr und Industrie kontrolliert (also fixed effects), da diese Dimensionen auch intuitiv auf den ersten Blick einen Unterschied machen (hierzu habe ich einfach jeweils Jahr- und Industrie-Dummies eingefügt). Soweit so gut.
In der Literatur wird an dieser Stelle nun weiter noch auf Endogenität geprüft, und auch ich würde das unbedingt gerne machen (vor allem auf Simultanität da ich vermute, dass Unternehmen mit höherem Risiko von Anfang an auch schon mehr in CSR investieren). Hierzu wird in der Literatur oft ein 2SLS bzw. 3SLS Gleichungssystem aufgestellt. Ich hatte zu diesen Verfahren zuvor GAR keine Ahnung, habe mich allerdings eingelesen und das Ganze hoffentlich gut verstanden.
Ich weiß, dass ich eine instrumentelle Variable finden muss, die mit meiner unabhängigen und verdächtig endogenen Variable - in diesem Fall CSR - signifikant korreliert und diese verlässlich vorausberechnen kann, aber NICHT mit meiner abhängigen Variable RISK korrelieren darf. Ich glaube, diese auch gefunden zu haben (ein Dummy).
Nun habe ich in einem ersten Schritt Erwartungswerte für CSR berechnet (mit allen Kontrollvariablen und exogenen Variablen der Ausgangsregression bis auf RISK auf der rechten Seite), wieder nach Jahr und Industrie kontrolliert. Nachdem ich nun allerdings mit diesen Erwartungswerten die Ausgangsregression nochmals durch OLS approximiert habe, war CSR nicht mehr signifikant. Ich kann natürlich auch einfach nur Pech haben (entweder unglückliche IV oder tatsächlich Endogenität).
Was mich allerdings wundert, und leider reicht hier mein Statistikwissen nicht aus:
1) Entgegen der Ausgangsregression scheine ich nun auf extreme Multikollinearität der CSR Variable zu treffen (VIF>25), und ich kann mir nicht erklären wieso. Der einzige Unterschied ist, dass ich nun mit Erwartungswerten für CSR arbeite; alle restlichen Variablen sind gleich. "Womit" korreliert denn CSR plötzlich so stark? Und Kann dies der Grund dafür sein, dass meine Variable nun nicht mehr signifikant ist?
2) In der Studie, die als Grundlage meines Modells dient, kontrollieren die Autoren bei der 2SLS Approximierung im 2. Schritt NICHT nach Industrie. Das fand ich höchst seltsam und tat selbiges. Ergebnis: plötzlich ist meine CSR Variable (mit den Erwartungswerten, nicht den empirischen) hoch signifikant . Was kann denn der Grund hierzu sein? Mir fehlt das ökonometrische Verständnis, um zu verstehen, wieso man jetzt nun plötzlich nicht mehr nach Industrie kontrollieren sollte (ist das willkürlich?) aber INSBESONDERE wieso CSR plötzlich signifikant ist. WICHTIG: Wenn ich mit den "echten" empirischen CSR Daten arbeite, ist - wenn ich NICHT nach Industrie kontrolliere - die Variable NICHT signifikant. Wie kann ich mir erklären, dass sie jetzt mit den Erwartungswerten plötzlich signifikant ist?
Spaßeshalber habe ich das Ganze noch einmal probiert und im 2. Schritt mit den CSR Erwartungswerten gearbeitet, dieses mal zwar nach Industrie kontrolliert aber NICHT nach den Jahren. Und wieder: p<0.1% . Liegt dem ein statistisches Prinzip zu Grunde, wonach rein logisch Signifikanz entsteht (und somit umbeachtlich ist), oder MUSS ich eventuell sogar im 2. Schritt auf die Jahres- oder Industrie-Kontrolle verzichten? :-/
Ich hoffe, jemand kann mir vielleicht weiterhelfen!
VG Thomas