Hi Leute,
also ich verwende einen Paneldatensatz für meine Masterarbeit. Dieser besteht aus 7 Wellen und meine abhängige Variable ist die Wahlabsicht für oder gegen eine bestimmte Partei. Diese wurde auch in allen 7 Wellen abgefragt. Da es leider keine Zeitvariable in dem Datensatz gibt, transformiere ich den Datensatz von wide in das long-Format. Meine Frage ist nun, ob ich meine abhängige Variable in einer Variable zusammenfassen soll oder schlussendlich nur die Frage zur Wahlabsicht von der letzten Welle nehme und als abhängige Variable habe?
Sprich so sieht es dann aus: Wahl1 Wahl2 Wahl3 Wahl4 Wahl5 Wahl6 Wahl7-->durch reshapen wird es dann eben eine Variable, also Wahl. Soll ich dann diese eine Variable als abhängige Variable benutzen?
Dann noch eine weitere Frage zu missings. Leider ist es im Datensatz so, dass nicht alle Fragen bzw. Variablen immer abgefragt werden. Sprich z.B. Einstellungen zu Immigration werden nur in Wellen 1, 2, 3, 6 und 7 abgefragt, aber nicht in Welle 4 und 5. Wie handhabe ich es in der Panelregression mit diesen missings? Gibt es da einen Trick?