Hallo liebe Forengemeinschaft,
ich bin bei einer Arbeit für die Uni auf ein Problem gestoßen und wäre sehr dankbar für den ein oder anderen Tipp. Ich beschreibe erst mal die Ausgangssituation:
Bei der Arbeit geht es darum, den Einfluss der sozialen Herkunft auf das Erwerbseinkommen zu berechnen. Ich rechne also eine Regression, bei der das (logarithmierte) Erwerbseinkommen mit den jeweils höchsten Bildungsjahren der Eltern, dem jeweils höchsten Berufsprestige der Eltern (beides metrisch) und einigen Kontrollvariablen erklärt werden soll.
Dabei stoße ich nun auf folgendes Problem: Da Berufsprestige und Bildung der Eltern stark miteinander korrelieren, haben sie einen großen gemeinsamen Effekt. Wenn ich beide Variablen in die Gleichung mit aufnehme, ist daher keine von beiden signifikant (da sich der gemeinsame Effekt auf beide Variablen aufteilt). Wenn ich nur die Bildung der Eltern oder nur das Berufsprestige der Eltern mit in die Gleichung aufnehme, ist die jeweilige Variable signifikant, da der gesamte gemeinsame Effekt der jeweiligen Variable alleine zukommt (und vermutlich auch, weil die Zahl der fehlenden Werte sinkt und somit die Freiheitsgrade steigen).
Meine Frage ist jetzt, wie ich mit diesem Befund umgehe:
Wenn ich nur eine Variable in die Gleichung aufnehme, ist sie zwar signifikant, aber der Effekt des Konstrukts "soziale Herkunft" wird unterschätzt, da ja der Effekt, der allein von der entfernten Variable beigetragen wird, wegfällt.
Die Alternative, die mir jetzt einfallen würde, wäre Bildung und Berufsprestige der Eltern zu einer Variable (also gewissermaßen einer Faktorvariable oder einem Index) zusammenzulegen. Dann könnte man die Effekte zwar nicht mehr getrennt voneinander beobachten, aber der Gesamteffekt und die Signifikanz würde stimmen. Meine Frage ist jetzt: Ist das praktikabel? Gibt es da eine Standard-Vorgehensweise? Wir haben das Thema Faktorbildung nur sehr grob angeschnitten und da ging es eher darum, wie viele Faktoren sinnvoll sind bzw. wie man einzelne Variablen einem Faktor zuordnet und nicht darum, wie man den Faktor dann tatsächlich erstellt.
Vielen Dank im Voraus
Julius
PS: Bildung und Berufsprestige haben einen verschiedenen Wertebereich. Die Bildung beinhaltet Werte von 7-18 (Bildungsjahren), das Berufsprestige Werte von 6-78 (Skalenpunkte).