Hallo,
ich schreib gerade an einer Arbeit, bei der ich sowohl eine lineare als auch eine logistische Regression rechne. Es geht dabei um die Frage, ob ein Migrationshintergrund einen negativen Einfluss auf den Erwerbsstatus bzw. das Bruttoeinkommen hat.
Nun meine Frage, welche die logistische Regression betrifft:
Ich habe 5 Gruppen gebildet, die wie folgt aussehen:
- Deutsche ohne Migrationshintergrund
- Deutsche mit indirektem Migrationshintergrund
- alte EU-Migranten mit direktem oder indirektem Migrationshintergrund
- neue EU-Migranten mit direktem oder indirektem Migrationhintergrund
- Mitgraten aus Drittstaaten mit direktem oder indirektem Migrationshintergrund.
In der logisitschen Regression werden die Deutschen ohne Migrationshintergrund als Referenzkatgeorie angegeben. Bis dahin funktioniert auch noch alles. Ich möchte nun aber auch wissen, welche Auswirkungen der indirekte bzw. der direkte Migrationshintergrund haben, d.h. ob es Unterschiede zwischen den Generationen gibt. Ich habe dazu die Variable Migrationshintergrund in 2 Dummy Variablen umgewandet, die Direkt (für einen direkten Migrationshintergrund) und indirekte (für einen indirekten Migrationshintergrund) heißen (Personen ohne Migrationshintergrund sind die Referenzkategorie). Wenn ich jetzt beide Variablen in die Analyse mitaufnehme, dann nimmt er mir SPSS eine wieder raus und es kommt folgende Meldung "Due to redundancies, degrees of freedom have been reduced for one or more variables". Ich habe auch versucht, die Variable Migrationshintergrund (0= keiner, 1= direkt, 2= indirekt) in die Analyse aufzunehmen, jedoch kommt es zum selben Ergebnis - es wird eine der Dummy-Variablen entfernt.
Darf ich etwa nur eine der beiden Variablen in die Analyse aufnehmen, da lediglich in der Referenzkategorie Personen ohne Migrationshintergrund sind??? Oder habt ihr vielleicht eine Idee, was ich da falsch mache?
Schonmal Danke für die Hilfe!
sarahfina12