Hey!
Ich stehe gerade auf dem Schlauch und vermute, dass ich irgendwie gerade zu doof bin, eine sehr simple Antwort auf mein Problem zu finden.
Ich arbeite gerade mit SPSS und führe eine lineare Regressionsanalyse durch. Ich habe als Fälle die Jahre 2008 bis 2018 und 4 AV sowie eine UV, wobei ich für jede AV eine Regression durchführe.
Jedenfalls habe ich nun das Problem, dass ich für das Jahr 2018 für die AV und die UV jeweils nur Daten für Januar bis Juni habe. Das heißt, mir "fehlt" sozusagen die zweite Jahreshälfte. Eine Regression, bei der ich nur das halbe 2018 einbeziehe, macht ja keinen Sinn, wenn alle anderen Jahre komplett sind. Aber ich würde 2018 gerne trotzdem in die Analyse mit einbeziehen.
Da ich schon mal eine - etwas anders ausgestaltete - lineare Regression durchgeführt habe, dachte ich eigentlich, dass die Lösung meines Problems eine Imputation wäre. Das hatte ich bei der letzten Regressionsanalyse auch schon mal erfolgreich durchgeführt.
Wenn ich jetzt aber in SPSS eine Imputation durchführe, erkennt SPSS zwar, dass überall 1 Wert fehlend ist, aber es wird nichts imputiert. Warum ist das so? Weil meine Fallzahl zu gering ist, eine Imputation in dem Kontext keinen Sinn macht oder liegt sonst irgendein Fehler vor, dass ich irgendwelche Einstellungen nicht richtig setze oder so?
Was ich mich nun frage bzw. mir denke ist, ob es nicht eine einfachere Methode gibt, wie man die Daten für die zweite Jahreshälfte "hochrechnen" bzw. umrechnen kann. An sich wäre ja der stupideste Gedanke, einfach alles mal zwei zu nehmen. Oder mit dem arithmetischen Mittel oder Median zu arbeiten. Aber mit Blick auf den Datensatz von 2018 macht das aus meiner Sicht auch keinen Sinn, weil die Zahlen nicht konstant sind, sondern eine unregelmäßig schwankende Entwicklung haben, wobei die Zahlen mehrheitlich von Monat zu Monat sinken. Das heißt, ich müsste schon irgendein ausgeklügelteres Hochrechnungsverfahren anwenden, ich bräuchte irgendeinen Gewichtungsfaktor. (Und ich dachte eigentlich, dass genau so auch eine Imputation funktioniert, dass eine Imputation quasi einfach nur ein ausgeklügelteres Hoch- oder Umrechnungsverfahren ist, simpel ausgedrückt (wobei mir klar ist, dass die Imputation eigentlich einfach eine Regression in der Regression ist)).
Also, ich würde mich sehr über einige Ideen freuen, besten Dank!