Behandlung fehlender Werte

Alle Verfahren der Regressionanalyse.

Behandlung fehlender Werte

Beitragvon laura22 » Fr 10. Jan 2014, 18:46

Hallo zusammen,

ich beschäftige mich in meiner Abschlussarbeit gerade mit der Behandlung fehlender Werte und bin mir diesbezüglich unsicher.
Ich bin bisher folgendermaßen vorgegangen:
Zunächst habe ich zur Berechnung der Skalen eine bestimmte Anzahl an fehlenden Items toleriert. SPSS-Syntax: Mean.X(Var1, Var2….). Im Manual einer der verwendeten Skalen steht, dass ich bei nur einem fehlenden Skalenwer die Skala berechnen sollte bei mehr als einem fehlenden Wert hingegen nicht (die Skala besteht aus 15 Items). In den Testmanualen der anderen Skalen steht dazu nichts.
Ist es denn eine übliche Vorgehensweise den Mittelwert trotz fehlender Items zu berechnen? Kann ich das auch bei den restlichen Skalen so machen und wie viele fehlende Itemwerte kann ich maximal tolerieren? Wären 10% ok, also 1 Item bei einer Skala, die sich aus 10 Items zusammensetzt oder können mehr fehlende Werte toleriert werden?

Ich möchte außerdem mit diesen Daten zwei moderierte Regressionen rechnen (mit jeweils unterschiedlichen AVs aber identischen UVs)
Meine Gesamtstichprobe umfasst 294 VPn.
Durch listenweisem Fallausschluss fließen in die erste Regression 7,8% weniger VPn in die Analyse ein, während es bei der zweiten Regression 12% VPn weniger sind. Dies liegt daran, dass bei der 2. AV zusätzlich ein Lügenkriterium bei der Berechnung der Skala berücksichtigt wird. Beide Interaktionen sind signifikant.
Sollte ich anstatt des listenweisen Fallausschlusses die fehlenden Skalenwerte durch den Gesamtmittelwert ersetzen? Oder ein anderes Impuationsverfahren durchführen?

Vielen Dank für eure Hilfe!
Viele Grüße
laura22
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Sa 29. Jun 2013, 14:59
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Behandlung fehlender Werte

Beitragvon Albrecht » Fr 10. Jan 2014, 23:48

Das hängt von der Literatur ab, die Du zitierst.

Best-Practice ist derzeit wohl die multiple Imputation. Die geht aber nicht mit SPSS. Dabei wird der gesamte Datensatz mehrfach neu geschätzt.

Praktisch würde ich sagen, dass Du etwas machen musst. Wenn der Verlust <5% wäre, fände ich den listenweisen Ausschluss okay.

Schau mal nach:

Lüdtke, O., Robitzsch, A., Trautwein, U. & Köller, O. (2007). Umgang mit fehlenden Werten in der
psychologischen Forschung. Probleme und Lösungen. Psychologische Rundschau, 58 (2), 103-
117.

Tabachnick, B. G. & Fidell, L. S. (2007). Cleaning up your act. Screening data prior to analysis. In: Using
multivariate statistics (pp. 60-116). Boston: Pearson.
Albrecht
Veteran
Veteran
 
Beiträge: 273
Registriert: Di 26. Nov 2013, 13:04
Danke gegeben: 32
Danke bekommen: 54 mal in 54 Posts

folgende User möchten sich bei Albrecht bedanken:
laura22

Re: Behandlung fehlender Werte

Beitragvon strukturmarionette » Sa 11. Jan 2014, 01:04

Hi,

Best-Practice ist derzeit wohl die multiple Imputation. Die geht aber nicht mit SPSS


Das:

//SPSS/Analysieren/Multiple Imputation

haben sie bei SPSS (V.22) wohl neu eingebaut.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
Albrecht, laura22

Re: Behandlung fehlender Werte

Beitragvon Albrecht » Sa 11. Jan 2014, 01:06

Wow, okay, Danke für den Hinweis.
Dann wird es ja noch einfacher!
Albrecht
Veteran
Veteran
 
Beiträge: 273
Registriert: Di 26. Nov 2013, 13:04
Danke gegeben: 32
Danke bekommen: 54 mal in 54 Posts

Re: Behandlung fehlender Werte

Beitragvon laura22 » Sa 11. Jan 2014, 15:39

Vielen Dank für den Hinweis. Bzgl. Multipler Imputation werde mich einlesen.

Was ich grundsätzlich nicht verstehe ist, ob man zunächst alle fehlende Itemwerte ersetzt und dann aus diesen Items die entsprechende Skala berechnet oder, ob man Skalen bildet (und dabei keine oder nur einige fehlende Itemwerte toleriert --> Mean.X) und dann erst die fehlenden SKALENwerte durch ein bestimmtes Verfahren ersetzt. Vielleicht könntet ihr mir diesbezüglich mal einen praktischen Rat geben.

Wäre eine Alternative auch Hot-Deck? Wie wählt man eigentlich die „deck variables“ aus - sind es die, die höchsten Korrelationen mit der lückenhaften Variablen aufweisen? Kann ich bei Hot-Deck auch metrische Variablen als „deck variables“ benutzen?
laura22
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Sa 29. Jun 2013, 14:59
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 11 Gäste