Liebes Statistik-Forum,
im Rahmen meiner Abschlussarbeit würde ich gerne untersuchen wovon die Höhe von Gehältern abhängig ist.
Mir liegen unbalancierte Paneldaten vor und ich würde gerne sowohl zeitkonstante, als auch zeitvariable Faktoren untersuchen.
Konkret gesprochen liegen Gehaltsdaten von verschiedenen Personen in unterschiedlichen Firmen zu unterschiedlichen Zeitpunkten vor.
Dazu gibt es zeitveränderliche Variablen wie die Anzahl der Vertragsabschlüsse, das Alter der Person, usw. aber eben auch zeitkonstante wie die Anzahl der Vertragsabschlüsse der Person in seiner gesamten Karriere.
Weiterhin möchte ich auch Dummy-Variablen mit untersuchen, wie z.B. die Hautfarbe (0 oder 1) und das Geschlecht (0 oder 1), um auf Diskriminierung zu prüfen.
Ich habe mich ein wenig in das Thema Regressionsanalyse mit Paneldaten eingelesen und würde als geeignetes Analysemodell das Fixed-Effects-Modell auswählen.
Allerdings können hier ja, wenn ich es richtig verstanden habe keine zeitkonstanten Variablen mit untersucht werden, da die Niveauunterschiede um den Mittelwert der Gruppen (bsp. Firmen) bereinigt werden.
Ich frage mich nun, wie man trotzdem eine gute Analyse umsetzen kann und welches Vorgehen das richtige ist.
Dazu hätte ich noch die Frage weshalb in vielen Analysen Variablen in der Regressionsgleichung zusätzlich quadriert als auch als kubischer Term mit in die Gleichung aufgenommen werden.
Sollten meine Fragen unlogisch erscheinen, bitte ich das zu entschuldigen! Ich bin noch ein neuling auf dem Gebiet und bin über jede Hilfe dankbar
Euch einen schönen Sonntag!