Hallo zusammen,
aktuell sitze ich an einem etwas - für mich - undurchsichtigen Problem.
Wenn ich ein Cluster Sample mit 2 Stufen habe (z.B. Befragung von 200 Arbeitnehmer aus 50 Unternehmen), so sagt die einschlägige Literatur, dass
1.) eine einfach OLS-Regression nicht sinnvoll ist, da die Clusterkorrelation zwischen den Untersuchungseinheiten dazu führt, dass Signifikanztests am Ende zu falschen Aussagen gelangen könnten
2.) den Clustereffekten durch entsprechende Korrekturen im Rahmen der Schätzung Rechnung getragen werden muss.
Zu 2.) gibt es jetzt eine ganze Reihe von Vorschlägen (z.B. Fixed Effects, Random Effects, Korrektur des Standardfehlers, etc.). Und dazu auch schon meine Erste Frage:
A.) Wenn es darum geht, die Effekte der Cluster zu trennen, um Clustereffekte zu vermeiden, warum kann ich das nicht einfach mit einer Dummyvariable für jeden Cluster realisieren? Ich vermute, das das ohne Weiteres nicht geht, da ich es nirgendwo gefunden habe... gleichwohl interessiert mich, warum nicht?
Ich würde mich total freuen, wenn mir da jemand einen guten Tipp geben könnte.
Vielen Dank,
Wiwi