Hallo Leute,
In meiner Masterarbeit geht es um eine Bilanzposition, welche als Proxy Variable für Marketingkosten verwendet wird. Da der Korrelationskoeffizient ein Gütekriterium für Proxyvariablen ist, würde mich natürlich interessieren, welche Variablen die Stärke der Korrelation zwischen der Proxy Variable und den tatsächlichen Marketingkosten beeinflussen. Ich werde eine Random Effects Regression durchführen. Die letzten Fragen die offen sind, sind nachstehende:
- Eine der erklärenden Variablen, die ich in meiner multiplen Regression berücksichtigen möchte, ist die Industrie, in der das Unternehmen tätig ist. Hierfür verwende ich einen Industriecode (SIC). Ich verwende den Bereich von SIC 20 – 49. In jeder der 30 betrachteten Industrien habe ich ggw. 12 Unternehmen von Excel zufällig ziehen lassen. Leider gibt es zwei Industrien (zwei SIC Codes) , in welcher mein Daten-Set nur 6 bzw. 9 Firmen beinhaltet. Meine Frage ist nun, was ich mit diesen Industrien mache. Soll ich sie begründet aus meiner Grundgesamtheit entfernen, oder kann ich die 6 bzw. 9 Unternehmen in der Regression dennoch berücksichtigen? Ich habe bedenken, dass dann diese Industrien nicht mit der gleichen Gewichtung wie die anderen in die Regression einfließen und somit das Ergebnis verzerrt wird.
- Fast analog dazu ist meine letzte Frage. Ich betrachte nun nicht einen Zeitraum von 3, sondern von 5 Jahren. Meine Betreuerin ist daran interessiert, dass ich für zeitliche Effekte in meiner Regression kontrolliere. Wenn ich nun Unternehmen habe, welche mir nur für 4 oder 3 Jahre Daten liefern, wie gehe ich dann vor? Aktuell habe ich solche Unternehmen noch in meiner Grundgesamtheit. Ich könnte das gesamte Daten-Set aber bereinigen, so dass ich nur noch Unternehmen mit Daten der gesamten 5 Jahre in meiner Grundgesamtheit habe. Die Bedenken sind analog zu denen meiner zweiten Frage. Wenn ich den zeitlichen Effekt in meiner Regression berücksichtigen möchte, und ich den Zeitraum der Betrachtung auf 5 Jahre normiert habe, müsste ich dann nicht Unternehmen mit Daten für weniger als 5 Jahre löschen?
Ich bedanke mich für Ihre Hilfe im Voraus und wünsche Ihnen einen schönen Tag.
- Aktuell habe ich ja gleichgewichtet aus den Industrien SIC 20 - 49 jeweils 12 Unternehmen gezogen. Nur die Unternehmen der entsprechenden Industrien sind für mich interessant. Grundlegend ist die Frage, ob es ok ist aus jeder Industrie die gleiche Anzahl an Unternehmen zu ziehen, oder ob ich eine Zufallsziehung von ca 300 Unternehmen aus den gesamten Industrien vornehmen soll, so dass die Industrien nicht alle gleichgewichtet in die Industrie eingehen. Wo wäre dort der Unterschied?
Vielen vielen Dank für Euren Support. Ich würdet mir SEHR helfen - Habt einen schönen Tag.
Cheers, Christoph