Hallo Leute,
für meine Masterarbeit verwende ich Paneldaten, da ich einen Effekt über die Zeit hinweg zeigen möchte. Konkret möchte ich u.a. den Einfluss von Einstellungen gegenüber Immigration auf die Wahlabsicht über einen gewissen Zeitraum zeigen. Dafür benutze ich eben Paneldaten. Die Befragten wurden insgesamt in 7 Wellen befragt. Die abhängige Variable ist nun Wahlabsicht mit CDU/CSU, SPD, Grüne, FDP, Linke und AfD und wurde in allen 7 Wellen abgefragt. Die unabhängige Variable ist Immigrationseinstellungen und geht von 0=Zuwanderung sollte eingeschränkt werden bis 1=mehr Zuwanderung ist in Ordnung und ist somit linear.
Problematisch ist aber nun, dass diese unabhängige Variable nicht in allen 7 Wellen abgefragt wurde, sondern nur in Welle 1, 3, 4, 5 und 7. Ich wollte nun eine logistische Panelregression machen, finde es aber problematisch, dass eben meine unabhängige Variable nicht konsistent abgefragt wird.
Daher mehrere Fragen: 1. Wie schlimm ist es nun, dass diese unabhängige Variable nicht durchgehend abgefragt wird?
2. Dann war meine Überlegung, eben jeweils für die Wellen 1, 3, 4, 5 und 7 querschnittliche Regressionen durchzuführen. Geht dies auch oder wäre dies statistisch falsch?
3. Wenn ich eine logistische Panelregression mache, wie sieht dann die abhängige Variable Wahlabsicht aus? Also soll ich diese zum letzten Zeitpunkt 7 nehmen oder sozusagen zusammenfassen (da die Daten im Wide Format sind würde ich dies dann in das long-Format übertragen)?