Hallo zusammen!
Ich habe eine vermutlich sehr grundlegende Frage, die mir trotz längerer Recherche offen bleibt.
In aller Kürze: Führt die Verwendung von Moderatorvariablen zu einer Umgehung des Endogenitätsproblems? Ic hbin da verwirrt. Aus Studiengründen darf ich mit der Wirkung eines erhöhten Frauenanteils in Führungsgremien auf den Unternehmenserfolg auseinandersetzen. Dabei fällt u.a. auf, dass oftmals einfache Korrelationen als Beleg - je nach Studie - für oder wider eine Erhöhung des weiblichen Anteils in Aufsichtsrat/Vorstand angeführt werden. Über die Jahre hinweg scheinen die Studien ansspruchsvoller geworden zu sein, insbesondere ist man sich der Endogenitätsproblemtik bewusst. Oftmals werden zusätzlich zu multiplen Regressionsanalysen unter Berücksichtigung diverser Kontrollvariablen auch Moderator- und Mediatorvariablen verwendet. Zwar schreiben die Autoren dann nicht explizit, dass damit Endogenität adressiert wird, allerdings ändern sich durch Einführung von Moderatorvariablen (bspw. der Konzentrationsgrad der Eigentümerstruktur/Aktionäre) teilweise die statistischen Signifikanzen erheblich und teilwesie drehen sich die vorzeichen der Regressionskoeffizienten.
Mir ist bewusst, dass eine Moderatorvariable als eine Variable definiert ist, die die Richtung und/oder Stärke des Zusammenhangs zwischen einer unabhängigen und einer abhängigen Variable beeinflusst. Ebenso ist mir klar, dass Endogenität mehrere Ursachen haben kann, insbesondere simultane Kausalität und nicht berücksichtigte erklärende Variablen.
Ich habe dennoch ein paar Fragen:
Ist die Berücksichtigung einer Moderatorvariable ein ähnliches Instrument wie das der Instrumentvariable (ist eine Moderatorvariable gar eine Instrumentvariable????), um mit dem Problem der Endogenität umzugehen??? Ich denke nicht, würde das aber gerne kurz nochmals betätigt und ggf. erklärt haben.
Und insbesondere: Ist es möglich, dass auch nach Berücksichtigung einer Moderatorvariable weiterhin Endogenität vorliegt? Ich habe oft den Eindruck, als ob die Autoren solcher Studien den Eindruck erwecken wollen, als ob durch die Berücksichtigung von Moderatorvariablen der heilige Gral gefunden wäre. Ist es nicht so, dass auch zwischen den Moderatorvariablen und dem Störterm u eine Korrelation bestehen kann und man deshalb - da Moderatorvariablen erstmal nichts anderes sind als weitere unabhängige Variablen - auch hier (wie auch zwischen den unabhängigen Variablen und dem Störterm) die Endogenitätsproblematik berücksichtigen muss?
In einem einfachen Regressionsmodell y=beta0+beta1*x+u soll der Effekt von x auf das y untersucht werden.
Trifft man die Annahme, dass der Regressor unkorreliert ist mit dem Störterm, ist der einzige, direkte Effekt von x auf y durch den Ausdruck beta1*x gegeben. D.h. x beeinflusst y, u beinflusst y aber x und u sind nicht korrliert!
Wenn es aber eine Beziehung zwischen x und u gibt (Korrelation), hat man doch zwei Effekte, richtig? Einmal den direkten Effekt durch beta1*x und dann den indirekten Effekt, bspw. durch eine unbeobachtete Drittvariable, die im Störterm erfasst ist und mit x korrliert ist! Weil sie x beeinflusst wird darüber nochmal - indirekt - y beeinflusst. Da man ja nur am alleinigen Effekt von x auf y interessiert ist benötigt man eine Vorgehensweise, die lediglich zu einer Variation von x führt: ein Experiment wäre der - oftmals nicht realisierbare - Idealfall.
Falls es aber eine Instrumentvariable z gibt und diese mit x, aber nicht mit u korreliert ist, kann man sich dem Idealfall eines natürlichen Experiments annähern.
z ist also korreliert mit dem Regressor x und unkorreliert mit dem Fehler u.
Wenn ich das richtig verstanden habe: die erste Annahme (z ist korreliert mit x) muss gegeben sein, damit man eine Beziehung zwischen dem Instrument z und dem Regressor x hat, der ja auf y wirkt.
Die zweite Annahme trifft man, weil sie das Instrument z als einen möglichen Regressor bzgl. y ausschließt, denn wenn y sowohl von x als auch z abhinge und man dann y nur auf x regressiert, z im Störterm u also absorbiert wird, sodass z ja gerade mit dem Fehler u korreliert ist, erhält man eine verzerrte Darstellung bzgl. der Auswirkung von x auf y. Mithilfe einer Instrumentvariable kann man also die Aussagegüte der Ergebnisse erheblich steigern.
Eine Moderatorvariable wird in der Regressionsgleich so dargestellt, dass man einen Interaktionsterm integriert, also: y=beta0+beta1*x1+beta2*x2+beta3*x1*x2+u. Ist das so korrekt? Kann dann nicht auch hier wieder jeweils eine Korrelation zwischen den abhängigen Variablen, dem Interaktinosterm und dem Störterm vorliegen? Nur durch Moderatorvariablen umgehe ich doch nicht das Problem der Endogenität, oder?
Vielen Dank schonmal!