Hallo,
ich schreibe momentan meine Bachelorarbeit zum Thema Gender Pay Gap und führe dazu eine empirische Untersuchung durch. Ich verwende für die Analyse Stata 17 und einen SOEP-Datensatz (genauer gesagt der SOEP-Core v36eu $pequiv).
Da ich nur für das Jahr 2018 einen GPG berechne, habe ich zunächst nur die Daten für das Jahr 2018 herausgefiltert.
Nun möchte ich mit der Einkommensvariable den Effekt vom Geschlecht anhand einer vorerst einfachen bivariaten linearen Regression errechnen (der unbereinigte GPG).
Der Datensatz hat nur Jahreseinkommen (sowohl Individual- als auch Haushaltseinkommen) als Variablen. Meine Frage ist jetzt, wie ich diese in einen Stundenlohn umrechnen kann?
Die Variable des 'Stundenlohns' will ich dann logarithmieren und als AV nutzen.
Das Codebook für den Datensatz gibt es hier: https://www.diw.de/de/diw_01.c.809654.d ... _soep.html
Die Einkommens-Variablen die ich nutzen möchte heißen i11110 und i11103
Außerdem hatte ich mich gefragt, wie ich anschließend korrekt gewichten kann. Im Datensatz gibt es nämlich eine Vielzahl an Gewichtungsvariablen und nun bin ich etwas überfordert, welche ich wie nutzen kann (Die Gewichtungsvariablen sind von W11101 bis W11111).
Ich denke, der Code könnte ungefähr so aussehen: reg ln_individualeinkommen i.geschlecht [iweight = w11101], r
Was denkt ihr?
Könnt ihr mir helfen?
Beste Grüße,
Dario Nitschke