Hallo zusammen,
ich habe ein paar kleine Fragen und hoffe ihr könnt mir eventuell weiter helfen. Ich habe schon einige Hilfe in anderen Themen gefunden, aber ein paar Sachen konnte ich bisher leider nicht rausfinden.
Ich mache momentan eine Regressionanalyse bzgl der Einkommensunterschiede zwischen Männern und Frauen. Soweit so gut, die Regression habe ich mit SPSS auch ganz gut hinbekommen, allerdings habe ich nun ein paar Probleme beim Auswerten.
Das Erste Problem kam beim T-Test. Mit den Daten von der Verdienststrukturerhebung habe ich über 60000 Freiheitsgrade, was natürlich in keiner Tabelle zu finden ist. Ich habe an einigen Stellen gelesen, dass man bei großen Stichproben dann die Normalverteilung benutzen kann. Allerdings komme ich da leider auch nicht weiter. Wie komme ich denn mit der Normalverteilung auf den entsprechenden Wert?
Bei der 2. Sache bin ich mir nicht mal sicher, ob es sich tatsächlich um ein Problem handelt. Die Daten hatten das Geschlecht mit 1 für männlich und 2 für weiblich codiert. Daran habe ich für die Regression auch nichts geändert. Nun hab ich allerdings überlegt, dass das Geschlecht ja eigentlich eine Dummy-Variable ist? Können diese trotzdem mit 1 und 2 codiert sein oder müsste ich das ganze nicht eigentlich auf 0 und 1 ändern? Ich bin mir gerade sehr unschlüssig, ob sich dadurch an der Regression tatsächlich viel ändern würde. Ich hatte auch überlegt evtl. Interaktionsterme in die Regression mit reinzunehmen (ich dachte da z.B. an die Region, welche bis jetzt auch mit 1 und 2 codiert ist) In dem Fall müsste ich dann eigentlich beide auf 0 und 1 ändern, oder?
Ich hoffe hier findet sich jemand, der mich versteht und eventuell ein paar Tipps geben kann.
Vielen Dank euch schonmal
LG