Regressionsmodell für Paneldaten bei Querschnittsfrage

Alle Verfahren der Regressionanalyse.

Regressionsmodell für Paneldaten bei Querschnittsfrage

Beitragvon Andy_S » So 2. Aug 2015, 21:49

Hallo liebes Forum,

ich schreibe gerade an einer Studienarbeit und untersuche dabei Unternehmensdaten (Bilanzen) im Zeitraum von 2008-2012 von ca. 500 Unternehmen, wobei nicht für alle Jahre zu jedem Unternehmen Infos vorliegen. Ich würde den Datensatz als unbalanciertes Panel charakterisieren.

Ich gehe der Frage nach, ob der Verschuldungsgrad als AV von strukturellen Faktoren wie bspw. der Unternehmensgröße, der Region (Ost/West), der Branche, Eigentümer (privat/öffentlich) abhängt. Diese UV sind allesamt diskret, auch Unternehmensgröße habe ich in Klassen eingeteilt. Um den Zusammenhang statistisch zu prüfen, möchte ich ein multivariates Regressionsmodell berechnen und schauen, ob die UV signifikant sind und wie stark der Einfluss ist, also Betrag des Koeffizienten.

Momentan ist mein Problem, dass ich mir nicht sicher bin, wie ich mit dem Panelstruktur der Daten umgehen soll. Folgende Überlegung habe ich: Ich habe Paneldaten, da mehrere Messpunkte der gleichen Unternehmen über die Zeit auftauchen. Somit darf ich nicht einfach so tun, als wäre das kein Problem und ein gepooltes OLS-Modell laufen lassen. Regressionsmodelle für Paneldaten sind FE und RE. Eine Modellauswahl sollte immer unter Berücksichtigung der Fragestellung erfolgen. Ich möchte hier wie bereits erläutert den Zusammenhang von strukturellen Faktoren, die in meinem Datensatz alle zeitkonstant sind (weder Eigentümer, noch Größe ändern sich im Untersuchungszeitraum) , bestimmen. Das ist eine klassische Querschnittsfragestellung, denn ich möchte einfach nur wissen, ob z.B. kleine Unternehmen höher verschuldet sind oder ob nicht die Größe, sondern eher die Region entscheidend für die Verschuldung ist. Somit habe ich für mich das FE Modell ausgeschlossen, weil es zeitinvariate Effekte durch Transformation eliminiert.

Beim RE Modell bin ich mir nicht sicher aufgrund der restriktiven Annahme, dass die Fehlerterme nicht mit den Variablen korrelieren. Ich Frage mich, ob es nicht "überdimensioniert" ist, ein Panelverfahren zu nutzen, obwohl ich nur zeitinvariate Einflüsse untersuchen möchte. Ich möchte alle Jahre des Datensatzes nutzen, um die Stichprobe zu vergrößern und alle Informationen effizient zu verwerten. Alternativ ist mir der Gedanke gekommen, einfach nur ein Jahr herauszugreifen und es mit einem gewöhnlichen OLS-Modell zu untersuchen. Wie würdet ihr vorgehen?

Besten Dank und viele Grüße
Andy_S
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 2. Aug 2015, 20:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell für Paneldaten bei Querschnittsfrage

Beitragvon Andy » Di 4. Aug 2015, 13:41

Hallo Andy,

ein paar Gedanken, die mir beim Überfliegen deines Anliegen so aufgefallen sind:
- Wie kommst du zu dem Entschluss, dass sich die Größe der Unternehmen über die zeit nicht ändert?
(weder Eigentümer, noch Größe ändern sich im Untersuchungszeitraum)

idR verändert sich die Größe durchaus. Unternehmenswachstum über diesen Zeitraum ist nicht unwahrscheinlich. wie misst du die Unternehmensgröße?
- Warum testest du nicht einfach, welches Modell angemessen ist? siehe Hausman, LM, F-Test
- Spontant würde ich sagen, dass es fixe Effekte gibt. Der Verschuldungsgrad ist von Branche zu Branche verschieden und demnach sollte mE zumindest industry effekte berücksichtigt werden. Ich würde sogar Zeiteffekte einbauen (was auch die meisten Studien tun).
Vielleicht hilft dir das etwas weiter.

BG
Andy
Andy
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Di 7. Aug 2012, 09:34
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell für Paneldaten bei Querschnittsfrage

Beitragvon Andy_S » Mi 5. Aug 2015, 12:59

Hallo Andy,

danke für deine Antwort!

Andy hat geschrieben: - Wie kommst du zu dem Entschluss, dass sich die Größe der Unternehmen über die zeit nicht ändert?


Die unabhängigen erklärenden Variablen sind alle über den Zeitraum konstant, dass habe ich anhand des Datensatzes geprüft. Dein Argument, dass es sich natürlich Änderungen in Unternehmensgröße ergeben können ist valide. Jedoch wird die Größe in drei Kategorien gemessen, sodass es dort keine Änderungen gibt.

Andy hat geschrieben:
Warum testest du nicht einfach, welches Modell angemessen ist? siehe Hausman, LM, F-Test


Ich wollte zuerst in eine konzeptionelle Diskussion hier im Forum einsteigen. Klar könnte man beide Modelle mittels der von dir genannten Tests mechanisch prüfen, jedoch heißt das noch nicht, dass es auch die richtigen Modelle für die Forschungsfrage sind.

Für mich ist noch die Frage offen, ob solche Panelverfahren die richtige Wahl für eine Querschnittfragestellung sind. Ich habe nur zeitinvariate UV und möchte deren Einfluss feststellen, wobei ich meinen Paneldatensatz möglichst effizient nutzen möchte.
Dazu noch Ideen / Anregungen ?


Andy hat geschrieben:
Spontant würde ich sagen, dass es fixe Effekte gibt


Dem stimme ich auch zu. Fixe Effekte gibt es natürlich, insb. zwischen den verschiedenen Branchen. Ziel der Untersuchung ist es ja eben, solche fixen Effekte zu bestimmen. Darum habe ich auch das FE-Modell ausgeschlossen, weil es fixe Effekte durch Transformation (Datenbereinigung um Mittelwerte) eliminiert. Mit dem FE-Modell kann ich eben nicht fixe Effekte bestimmen, sondern diese nur kontrollieren.
Andy_S
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 2. Aug 2015, 20:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell für Paneldaten bei Querschnittsfrage

Beitragvon Andy » Mi 5. Aug 2015, 14:37

Achso ok. War mir nicht klar, dass du deswegen nach dem geeigneten Modell fragst.
Spontane Anregungen: Auch wenn du eine Querschnittsfrage hast, ist die Prüfung im Panel mE schon sinnvoll (größere Stichprobe, verlässlicher wg. Größe und Zeitraum). Bei deinem Beispiel mit VG (variant) und Unternehmenscharakteristika würde ich in jeden Fall ein Panel nehmen, da makroökonmische Faktoren den VG von Unternehmen beeinflussen können (Zinspolitik, Krisen...). Der Einfluss der invarianten Variablen auf die variante Variable könnte sich über den Zeitverlauf ändern aber auch konstant bleiben. In jeden Fall würde ich ein Ergebnis aus einem Panel als verlässlicher erachten. Ich weiß nicht, ob dir diese Gedanken weiterhelfen, aber ich persönlich bin immer froh, wenn jemand seine Ideen mal weitergibt.
Was spricht den deines Erachten für eine einfache Querschnittsanalyse? Nur die invarianten Charakteristika?
Andy
Beobachter
Beobachter
 
Beiträge: 11
Registriert: Di 7. Aug 2012, 09:34
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell für Paneldaten bei Querschnittsfrage

Beitragvon Andy_S » So 9. Aug 2015, 10:45

Hallo Andy,

besten dank für deine Gedanken dazu! Ich sehe den gleichen Vorteil wie du in den Paneldaten: Mehr Informationen heißt höhere Aussagekräftigkeit. Deshalb ist es auch meine Ambition, den gesamten Datensatz für die Beantwortung der Querschnittsfrage zu nutzen.

Andy hat geschrieben:Was spricht den deines Erachten für eine einfache Querschnittsanalyse? Nur die invarianten Charakteristika?


Ich habe die Tage noch einmal Recherche betrieben und einige Bücher durchgeblättert. Leider finde ich nirgendwo Hinweise zu meinem Spezialfall mit ausschließlich zeit-invarianten Variablen. Mich verunsichert das etwas. Darum möchte ich mich vergewissern, ob es denn zulässig ist, Panelmodelle auf diesen Datensatz loszulassen.

Für eine einfache Querschnittanalyse, also das Herausziehen von einem Geschäftsjahr, spricht nur, dass ich mir dabei methodisch sicher bin, wie es funktioniert und es methodisch einfach ist und jeder versteht. Es geht mir darum, ein angemessenes simples Modell zu finden, das genau meine Querschnittsfrage beantwortet.

Was spricht denn dagegen, einfach ganz naiv die Daten der Jahre zu poolen und nur Jahres-Dummys einzuführen, die für alle UN gleich sind?
Andy_S
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 2. Aug 2015, 20:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsmodell für Paneldaten bei Querschnittsfrage

Beitragvon Andy_S » So 30. Aug 2015, 21:05

Hat jemand aus dem Forum noch weitere Ideen zu einem passendem Modell?

Danke!
Andy_S
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: So 2. Aug 2015, 20:12
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 18 Gäste

cron