Hallo, Ichs schreibe aktuell meine Bachelorarbeit und habe ein Problem bei der Durchführung einer Missing Data Analyse.
Infos vorab:
ich habe insgesamt 4 Hypothesen die besagen, besteht ein negativer Zusammenhang zwischen:
der Gedächtnisleistung x und dem Laborwert x,
der Gedächtnisleistung x und Laborwert y,
der Gedächtnisleistung y und Laborwert x,
der Gedächtnisleistung y und Laborwert y.
Als AV werden die Testverfahren (zur Gedächtnisleistung) eingesetzt, die nach Erhebung in Prozentränge umgerechnet wurden. Als UV hat man dann bei meiner Fragestellung die Laborwerte, Alter, Geschlecht, Bildung. Für die Hypothesenüberprüfung hatte ich bereits eine schrittweise Regression gerechnet.
Da viele Daten fehlen, soll ich zusätzlich eine Missing Data Analyse durchführen Habe aber sowas noch nie zuvor berechnet und mein Betreuer hat mir dann folgende schrittweise Erklärung geschickt:
- die 2 Testverfahren, die 2 Laborwerte und das Alter als Dummyvariablen erstellen
- die dummys dienen dann jeweils als AV, weitere Parameter sind Bildung, Geschlecht etc.
- Anschließend werden die AV's mit den Parametern in eine logistische Regression eingesetzt und entsprechend berechnet.
Ist das denn mit der log. Regression gängig oder wird eine Missing Data grundsätzlich anders berechnet?
Zudem kann ich die Dummys für das Alter und einem der Laborwerte zwar erstellen, allerdings erhalte ich bei der Berechnung der logistischen Regression dann folgende Fehlermeldung:
Die abhängige Variable weist weniger als zwei nicht-fehlende Werte auf. Für die logistische Regression muß der abhängige Wert an den verarbeiteten Fällen genau zwei Werte annehmen.
Bin über jede Antwort sehr dankbar!