Hallo!
Ich nutze die Panelbefragung NEPS für verschiedene Auswertungen. Ein wichtiges Element dabei ist die Angabe des Bundeslandes, in dem man wohnt.
Diese Frage wird bei manchen Teilnehmenden in allen Wellen gefragt / beantwortet, bei manchen Teilnehmenden jedoch nur selten.
Um möglichst viele aktuelle Antworten/Angaben über das Bundesland zu erhalten, habe ich die beiden aktuellsten Wellen 9 und 10 zusammengefasst.
Wie kann ich "prüfen", ob das Zusammenlegen der beiden Wellen funktioniert hat?
Hier das konkrete Beispiel:
Angaben aller 10 Wellen hier: https://www.neps-data.de/Portals/0/NEPS ... ook_de.pdf (pdf-S. 2964)
Hier eine Beispielsyntax für Hessen (6):
IF (t751001_g2R.9=6 I t751001_g2R.10=6) t751001_g2R_neu=6
(das nur als Beispiel für ein Bundesland, diese Syntax-Zeile habe ich für alle 16 Bundesländer erstellt)
Ich habe bewusst das Zeichen I als oder genutzt, damit es sich ausgleicht, wenn die Befragten in beiden Wellen (W9 und W10) geantwortet haben.
Hier ein Beispiel dazu aus der Datenansicht:
W9 W10
6 6
Diese Angabe hilft aber auch, um die fehlende Angabe (dargestellt durch einen Punkt in der Datenansicht) in Welle 10 mit der Angabe aus Welle 9 auszugleichen. Hier illustriert:
W 9 W10
6 .
In meiner aus den Wellen 9 und 10 gebildeten Variable über das Bundesland hat sich für Hessen (6) ein Gesamt-N von 748 ergeben.
Fehlende Werte aus einzelnen Wellen scheinen sich ausgeglichen zu haben. In Welle 10 machten 608 Personen eine Bundesland-Angabe, in Welle 9 machten 701 Personen eine Angabe. Durch das "Zusammenlegen" der beiden Wellen wurden Bundesland-Angaben für 748 Personen ermittelt.
Gibt es eine Möglichkeit zu prüfen, ob die neue Variable korrekt berechnet wurde? Ein Aufsummieren aus Welle 9 und 10 ist unsinnig, da die gleichen Personen die Angabe zum Bundesland oftmals doppelt (in der Welle 9 und 10) gaben.
Über eine Rückmeldung würde ich mich freuen. Vielleicht auch über den Hinweis, dass ich nicht alles immer doppelt und dreifach prüfen muss.