Abhängige Variable und missings in Paneldaten

Alle Verfahren der Regressionanalyse.

Abhängige Variable und missings in Paneldaten

Beitragvon uiolo » Do 19. Sep 2019, 13:35

Hi Leute,

also ich verwende einen Paneldatensatz für meine Masterarbeit. Dieser besteht aus 7 Wellen und meine abhängige Variable ist die Wahlabsicht für oder gegen eine bestimmte Partei. Diese wurde auch in allen 7 Wellen abgefragt. Da es leider keine Zeitvariable in dem Datensatz gibt, transformiere ich den Datensatz von wide in das long-Format. Meine Frage ist nun, ob ich meine abhängige Variable in einer Variable zusammenfassen soll oder schlussendlich nur die Frage zur Wahlabsicht von der letzten Welle nehme und als abhängige Variable habe?

Sprich so sieht es dann aus: Wahl1 Wahl2 Wahl3 Wahl4 Wahl5 Wahl6 Wahl7-->durch reshapen wird es dann eben eine Variable, also Wahl. Soll ich dann diese eine Variable als abhängige Variable benutzen?


Dann noch eine weitere Frage zu missings. Leider ist es im Datensatz so, dass nicht alle Fragen bzw. Variablen immer abgefragt werden. Sprich z.B. Einstellungen zu Immigration werden nur in Wellen 1, 2, 3, 6 und 7 abgefragt, aber nicht in Welle 4 und 5. Wie handhabe ich es in der Panelregression mit diesen missings? Gibt es da einen Trick?
uiolo
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Di 6. Mär 2018, 10:57
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Abhängige Variable und missings in Paneldaten

Beitragvon PonderStibbons » Do 19. Sep 2019, 13:41

Meine Frage ist nun, ob ich meine abhängige Variable in einer Variable zusammenfassen soll oder schlussendlich nur die Frage zur Wahlabsicht von der letzten Welle nehme und als abhängige Variable habe?

Kommentieren kann man das schlecht weil die genaue Fragestellung für die Studie und die Auswertung nicht genannt ist.
Präzise wie sollte das Zusammenfassen aussehen?

Wie handhabe ich es in der Panelregression mit diesen missings?

Das kommt unter anderem auf die Fragestellung an und darauf, wie das Regressionsmodell aussieht.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11366
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Abhängige Variable und missings in Paneldaten

Beitragvon uiolo » Do 19. Sep 2019, 13:45

Also die Fragestellung lautet, ob das Thema Immigration im Zeitverlauf wichtiger wurde für das Wahlverhalten bzw. die Wahlabsicht. Die Hypothese dazu ist, dass das Thema Immigration im Laufe der Zeit wichtiger wurde für das Wahlverhalten.

Das Zusammenfassen würde dann so aussehen, dass ich die Variablen Wahl1, Wahl2, Wahl3, etc. zu einer Variable zusammenfasse, also nur die Variable Wahl besitze. Die Regression sieht dann so aus: xtlogit Wahl Immigration, fe
uiolo
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Di 6. Mär 2018, 10:57
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Abhängige Variable und missings in Paneldaten

Beitragvon PonderStibbons » Do 19. Sep 2019, 15:41

Also die Fragestellung lautet, ob das Thema Immigration im Zeitverlauf wichtiger wurde für das Wahlverhalten bzw. die Wahlabsicht. Die Hypothese dazu ist, dass das Thema Immigration im Laufe der Zeit wichtiger wurde für das Wahlverhalten.

Ich würde vorschlagen die Formulierungen präzise zu halten. Der erste Satz bezieht sich auf
Wahlverhalten bzw. Wahlabsicht, der zweite nur auf Wahlverhalten. Wann wurde Wahlverhalten
gemessen, zu t7? Der erste Satz spricht allerdings eher für eine getrennte Betrachtung der
7 Messungen.

Das Zusammenfassen würde dann so aussehen, dass ich die Variablen Wahl1, Wahl2, Wahl3, etc. zu einer Variable zusammenfasse, also nur die Variable Wahl besitze.

Nochmal: Präzise wie soll dieses Zusammenfassen aussehen? Addition? Maximum? Letzter Wert? Durchschnittswert?
Ich weiß auch nicht, wie "Wahl1", "Wahl2" etc. konkret gemessen wurde.
Die Regression sieht dann so aus: xtlogit Wahl Immigration, fe

Sagt mir leider nichts. Ich denke an Dinge wie "ich berechne eine logistische Regression mit der
abhängigen Variable Hauskauf ja/nein und den Prädiktoren (...)" und gegebenenfalls
mit den interessierenden Wechselwirkungen (für Moderatoreffekte wie "Immigration
wirkt je nach Zeitpunkt unterschiedlich stark auf die abhängige Variable"). Aber vielleicht
geht es hier um eine ganz Regressionsanalyse speziell für Paneldaten, die ich nicht kenne.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11366
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Abhängige Variable und missings in Paneldaten

Beitragvon uiolo » Do 19. Sep 2019, 16:44

Also die Wahlabsicht wurde in den Wellen 1-6 (t1-t6) abgefragt und Wahlverhalten in Welle 7 (t7), da nach der Bundestagswahl.

Das Zusammenfassen findet eben über die Transofrmation des Datensatzes vom wide-Format in das long-Format statt
uiolo
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Di 6. Mär 2018, 10:57
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Abhängige Variable und missings in Paneldaten

Beitragvon PonderStibbons » Do 19. Sep 2019, 16:56

Wie wurde "Wahlabsicht" denn konkret gemessen, mit welcher Frage und auf welcher Antwortskala?

Wenn "zusammenfassen" nicht zusammenfassen bedeutet, sondern Umstrukturierung der Daten, dann
wäre, wie andernorts erwähnt, ein Mehrebenenmodell naheliegend (jede Person ist in "Cluster" von
Messungen aus bis zu 7 Zeitpunkten). Dann kann man das Problem von missings vernachlässigen, das
Verfahren benötigt keinen vollen Datensatz.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11366
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Abhängige Variable und missings in Paneldaten

Beitragvon uiolo » Do 19. Sep 2019, 18:23

Also Wahlabsicht wurde in Wellen 1-6 folgendermaßen abgefragt (ohne Missings, also z.B. nicht beantwortet oder keine Ahnung).
1=CDU/CSU; 2=SPD; 3=FDP; 4=Grüne; 5=Linke; 6=AfD

Wahlverhalten wurde in Welle 7 genauso abgefragt, nur die Fragestellung war leicht anders.

Zu der Mehrebenenanalyse: Weißt du vielleicht, wie man das in Stata modelliert? Also was der Befehl dafür ist?
uiolo
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Di 6. Mär 2018, 10:57
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Abhängige Variable und missings in Paneldaten

Beitragvon PonderStibbons » Do 19. Sep 2019, 19:44

https://www.unibw.de/hum-bildungswissen ... rungen.pdf

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11366
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Abhängige Variable und missings in Paneldaten

Beitragvon uiolo » Fr 20. Sep 2019, 09:30

Danke für die Folien.
Grundsätzlich aber nochmal die Frage mit der abhängigen Variable: Soll ich diese zu einem Zeitpunkt nehmen oder eben wie zuvor erklärt durch die Umstrukturierung der Daten zusammengefasst aus mehreren Zeitpunkten?
uiolo
Beobachter
Beobachter
 
Beiträge: 13
Registriert: Di 6. Mär 2018, 10:57
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Abhängige Variable und missings in Paneldaten

Beitragvon PonderStibbons » Fr 20. Sep 2019, 13:04

Das hängt von der Analyse ab. Bei einem Mehrebenenmodell langes Format.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11366
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron