Behandlung von missings in quantitativem Datensatz

Fragen, die sich auf kein spezielles Verfahren beziehen.

Behandlung von missings in quantitativem Datensatz

Beitragvon tobisax » So 21. Okt 2012, 21:39

Hi,

ich bin gerade dabei ein Modell zu entwickeln und zu untersuchen, das die Auswirkung einer Rezession auf die Bezahlung im öffentlichen Sektor Kanadas darstellt. Hierzu sollen einige Moderatoren und CVs eingebunden werden.
Eine davon ist die "union density" im public sector.

Jetzt zur Frage: Die Daten die ich habe geben mir leider lediglich Informationen zur union density im public sector in den Jahren 1987 - 1995. Die Untersuchung soll sich jedoch von 1981 - 2011 erstrecken. Darüber hinaus habe ich jedoch Daten zur allgemeinen Union density (über alle Sektoren) in Kanada.
Mir fehlen also ganz konkret die Daten zur "union density in the public sector" von 1981-1986 und 1996-2011.

Ich habe mir zum Thema missing values bereits einige Artikel durchgelesen und bin immer wieder auf die conclusion gestoßen, dass multiple imputation die beste Methode ist. Die Frage die sich mir jetzt jedoch stellt ist, ob ich das Verfahren für meinen Fall anwenden kann oder es andere, besser passendere Verfahren gibt. So wie es sich mir in der Literatur darstellt wird "multiple imputation" ja eher bei Surveys verwendet.

Es würde mich riesig freuen wenn mir jemand dabei helfen könnte.

Grüße und besten dank
Tobias
tobisax
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 21. Okt 2012, 21:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Behandlung von missings in quantitativem Datensatz

Beitragvon daniel » Mo 22. Okt 2012, 12:48

Multiple imputation (MI) ist nicht auf surveys beschränkt, sondern ein allgemeines Konzept, dessen besondere Stärke darin liegt, die Unsicherheit beim Ersetzen fehelender Werte berücksichtigen zu können. Ob das Verfahren geeignet, und v.a. auch umestzbar ist, kann ich aus Deinen Informationen schlecht schließen. Allgemein gehe ich mit Allison (2002), der neben listwise deletion zu Modellbasierten Ansätzen rät. Soweit ich verstehe kommt für Dich listwise nicht in Frage. Ich nehem zudem an, dass Du neben Punktschätzern auch an statisitscher Inferenz interessiert bist. Dir bleibt in diesem Fall also MI oder FIML (full information maximum-likelihood). Der kritische Punkt beider Ansätze ist, dass Du ein pausibles Modell brauchst, und genügend Informationen (i.e. Variablen) in den vorhandenen Daten.


Allsion, Paul D. (200). Missing Data. Thousand Oaks: Sage.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Behandlung von missings in quantitativem Datensatz

Beitragvon tobisax » Mo 22. Okt 2012, 18:49

Hi Daniel,
besten Dank für die Anwort. Über Allison bin ich auch schon gestolpert. Dann werde ich mal schauen ob ich mir ein passendes Modell basteln kann oder Statistics Canada kommt doch noch mit einem besseren Datensatz ums Eck :-)
tobisax
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 21. Okt 2012, 21:26
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 15 Gäste