Anpassungsgewichtung - Propensity Score Weighting

Fragen, die sich auf kein spezielles Verfahren beziehen.

Anpassungsgewichtung - Propensity Score Weighting

Beitragvon Semson » Mi 29. Jan 2014, 14:52

Hallo zusammen!
Ich habe eine Brutto Stichprobe (Adressdaten, Alter, Geschlecht) von 2000 Personen aus dem Meldeamtsregister. Von diesen 2000 Personen haben gut 500 Personen an der Befragung teilgenommen. Ich habe eine binäre Variable für Teilnahme/Nicht-Teilnahme erstellt und möchte nun überprüfen, ob die Daten aus dem Register die Teilnahme vorhersagen können oder nicht (logistische Regression - daher die Frage in diesem Forum).
Mit anderen Worten: Habe ich einen Unit-Nonresponse-Bias oder nicht. Falls sich die Teilnehmer von den Nicht-Teilnehmern hinsichtlich der Merkmale unterscheiden, so würde ich gerne eine Gewichtung vornehmen, um die Stichprobendaten hinsichtlich der Daten der amtlichen Statistik anzupassen und den Nonresponse-Bias zu beheben.
Als Hilfsvariablen will ich Alter und Geschlecht verwenden.

Ich suche eine Art Anleitung, wie ich hierbei ganz praktisch vorgehe.
- Wie berechne ich das Gewicht?
- Wie wende ich das Gewicht an?

Vielen Dank für Euren Rat!
Semson
Power-User
Power-User
 
Beiträge: 80
Registriert: Mi 27. Nov 2013, 11:22
Danke gegeben: 2
Danke bekommen: 15 mal in 15 Posts

Re: Anpassungsgewichtung - Propensity Score Weighting

Beitragvon strukturmarionette » Sa 1. Feb 2014, 18:52

Hi,

Ich habe eine binäre Variable für Teilnahme/Nicht-Teilnahme erstellt und möchte nun überprüfen, ob die Daten aus dem Register die Teilnahme vorhersagen können oder nicht


Falls sich die Teilnehmer von den Nicht-Teilnehmern hinsichtlich der Merkmale unterscheiden, so würde ich gerne eine Gewichtung vornehmen, um die Stichprobendaten hinsichtlich der Daten der amtlichen Statistik anzupassen und den Nonresponse-Bias zu beheben.


Wenn du mit Alter und Geschlecht eine Teilnahme vorhersagen willst, braucht für eine binär logistische Regression nichts gewichtet zu werden.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Anpassungsgewichtung - Propensity Score Weighting

Beitragvon Semson » Mo 3. Feb 2014, 12:36

Hi und danke für die Antwort.

Ich habe mich leider nicht so deutlich ausgedrückt, wie ich gekonnt hätte.
Mein Ziel ist nicht, die Daten zu gewichten, um eine Regression auf die Teilnahme zu berechnen. Ich möchte die Daten gewichten, um den Unit-Nonresponse-Bias bzw. die Abweichungen der Stichprobenkennwerte von der Population zu beheben/minimieren.

Die Regression war hierbei nur ein Mittel, um festzustellen, welche Variablen für eine solche Gewichtung überhaupt relevant sind. Da ich eine Auswahldatei mit allen potentiellen Teilnehmern und einer Variable für die, die tatsächlich teilgenommen habe, konnte ich das machen. Da das Geschlecht z.B. keinen signifikanten Einfluss auf die Teilnahmevariable hat, gehe ich davon aus, dass Geschlecht nicht Gewichtungsrelevant ist.

Für eine „Anpassungsgewichtung“ an die amtliche Statistik gibt es in etwa folgende Vorgehensweise:

1.) Variablen bestimmen, die für die Anpassung verwendet werden sollen. Es müssen Variablen sein, die für die Population verfügbar sind. Üblicherweise amtliche Statistiken wie Geschlecht, Alter, Staatsbürgerschaft. Jeweils auf unterschiedlichen Aggregatebenen. Gemeinde, Landkreis, Bundesland, Land. Ich würde hier auf Landkreis-Ebene abzielen.
- d.h. Vergleichvariablen: Alter, Staatsbürgerschaft, evtl. Geschlecht
- Vergleichsdaten: amtliche Statistiken, Landkreisebene.

2.) Ich habe eine binäre logistische Regression auf die Teilnahme [0/1] mit den verfügbaren Daten gemacht habe und nur Alter und Staatsbürgerschaft hatten einen signifikanten Einfluss ( korr. R-Quadrat war nur 0,027). Die (Nicht-)Teilnahme wird also vom Alter beeinflusst.

3.) Gewichte bestimmen
- Stichprobe in Subgruppen aufteilen, die sich durch die Kombinationen der Hilfsvariablen ergeben ==> d.h. Alter in Kategorien aufteilen.
Zelle 1 wäre 18-25 Deutsch, Zelle 2 18-25 andere Staatsbürgerschaft, Zelle 3 26-35 Deutsch ... usw.
- Response-Rate pro Zelle bestimmen: d.h. Anteil der realisierten Teilnehmer pro Zelle / Anteil der Zelle in Population.
- Das Gewicht für jeden Teilnehmer ist dann der Kehrwert der Response-Rate in seiner Zelle.

Irgendwie kann man anstelle dieser Vorgehensweise mit den Zellen, auch eine logistische Regression durchführen um die Gewichte zu bestimmen. Und hier komme ich nicht weiter. Ich glaube, ich könnte aus der Regression die Auswahl- bzw. Antwortwahrscheinlichkeit einer Person bestimmen und hiervon wieder den Kehrwert als Gewicht benutzen.
Da man allerorten auf Datensätze mit Gewichtungsvariablen trifft, habe ich gehofft, dass das eine verbreitete Technik ist, die nur an mir vorbeigegangen ist ;)
Semson
Power-User
Power-User
 
Beiträge: 80
Registriert: Mi 27. Nov 2013, 11:22
Danke gegeben: 2
Danke bekommen: 15 mal in 15 Posts

Re: Anpassungsgewichtung - Propensity Score Weighting

Beitragvon strukturmarionette » Mo 3. Feb 2014, 21:58

Hi,

2.) Ich habe eine binäre logistische Regression auf die Teilnahme [0/1] mit den verfügbaren Daten gemacht habe und nur Alter und Staatsbürgerschaft hatten einen signifikanten Einfluss ( korr. R-Quadrat war nur 0,027). Die (Nicht-)Teilnahme wird also vom Alter beeinflusst.


M.W. gibt es bei der binär logistischen Regression kein korr. R².

3. ... Da man allerorten auf Datensätze mit Gewichtungsvariablen trifft,


Wo?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Anpassungsgewichtung - Propensity Score Weighting

Beitragvon Semson » Di 4. Feb 2014, 16:25

zur Regression: Stimmt, es war wohl Nagelkerkes R-Quadrat.

Zu
Wo?
da: http://www.gesis.org/unser-angebot/rech ... dskatalog/

Letzter Versuch zum eigentlichen Thema zu kommen:
Ich will ein Gewicht für Verzerrungen durch Unit-nonresponse erstellen.
a) Regression wie oben beschrieben
b) Regressionskoeffizienten und individuelle Ausprägungen der UVs nutzen, um für jede Person eine Teilnahmewahrscheinlichkeit zu berechenen
c) Kehrwert der so bestimmten Teilnahmewahrscheinlichkeit berechnen ==> ergibt Gewicht
d) Gewicht durch arithmetisches Mittel der Gewichte der Teilnehmer teilen

Falls da jemand nützliche Anmerkungen, relevante Quellen oder sogar Vorschläge zur Anwendung hat, würde ich mich sehr freuen.
Semson
Power-User
Power-User
 
Beiträge: 80
Registriert: Mi 27. Nov 2013, 11:22
Danke gegeben: 2
Danke bekommen: 15 mal in 15 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron