Liebe Community!
Mein Modell dreht sich um anteilsbasierte Vergütungen und untersucht deren Determinanten.
Abhängige Variable: Anteilsbasierte Vergütung
Unabhängige Variablen: Fixvergütung, variable Barvergütung, Eigentumsverhältnisse, etc.
Problem: nur jede zweite Firma in meinem Sample gewährt eine aktienbasierte Vergütung, sprich jeder zweite Datensatz hat den Wert 0.00.
Daraus ergeben sich zwei Möglichkeiten:
1) 0.00 Werte excluden und Modell mit der Hälfte der Datensätze rechnen
2) 0.00 Werte drinnenlassen und Modell mit dem gesamten Sample rechnen
Ich habe zuerst zu Variante 1) tendiert, da ich ja nichts untersuchen kann, das es garnicht gibt.
Allerdings hat Variante 2) auch was für sich, denn es könnte sich ja ein Zusammenhang zeigen, den ich mit Variante 1) nicht finden würde...zB könnte sich herausstellen, dass sofern der Staat einen gewichtigen Anteil am Unternehmen hält, keine anteilsbasierte Vergütung gewährt wird. Diesen Zusammenhang würde ich mit Variante 1) nie finden. Des Weiteren wird in der Regel das Nicht-Vorhandensein anteilsbasierter Vergütungen durch variable Barvergütungen kompensiert - ebenfalls ein Zusammenhang den ich mit Variante 1) nicht finden würde.
R²/Adjusted R² sind erstaunlicherweise sehr ähnlich bei beiden Varianten, mit Variante 2 finde ich allerdings mehr signifikante Zusammenhänge (die bei betrachtung der Rohdaten so auch Sinn machen...)
Was meint ihr? Wie siehts mit Verteilungsproblemen aus, wenn die Hälfte meiner abhängigen Variable 0.00 Werte aufweist?