Liebes Statistik-Forum,
ich benötige Hilfe für die korrekte Durchführung einer Multiplen Imputation. Mein Datensatz enthält hierbei ziemlich viele Items (ca. 170, 16 verschiedene Merkmale). Ich würde gerne nach dem Goldstandard streben und eine multiple Imputation vor der weiteren Datenanalyse durchführen. Nun stellen sich mir ziemlich allgemeine Fragen, die womöglich etwas blöd erscheinen, jedoch finde ich keine Literatur dazu. Bevor ich ruhigen Gewissens anfangen kann, würde ich mich hier gerne nochmal vergewissern, ob nicht jemand bei meinen Unsicherheiten helfen kann:
1. Soll ich alle Werte des Datensatzes in die Analyse fehlender Werte aufnehmen? Die Analyse fehlender Werte ist unglaublich unübersichtlich bei einer solchen Anzahl von zu berücksichtigenden Werten. Oder für jede Analyse eine gesodnerte Imputation durchführen? Wenn ich das tue, erhalte ich ein imputiertes Dataset, in dem nicht alle Variablen vorhanden sind und die imputierten Daten für die Messung eines Merkmals können sich zwischen den Datasets unterscheiden.
2. Welche Auswirkungen hat die Hochsetzung der Maximalanzahl von Kategorien? Da ich recht viele kategoriale Variablen in meinem Datensatz habe, habe ich sie auf 100 gesetzt. Es erscheint mir unproblematisch, aber bevor ich einen Fehler begehe...
Vielen lieben Dank für eure Hilfe!