Hallo,
ich hätte eine Frage zum Gewichten von Datensätzen. Vielleicht kann mir ja jemand weiter helfen...
Es geht darum, dass der Datensatz bzgl. Alter und Geschlecht der Bevölkerungsstruktur angepasst werden soll.
Ich habe nun mit Hilfe der amtlichen Statistiken die Gewichtungsfaktoren berrechnet:
Die Syntax für die Berechnung des Gewichtungsfaktors sieht so aus:
IF Alter_bevölk=1 and q30_Geschlecht=1 WEIGHT_BevRep=0.750499.
IF Alter_bevölk=1 and q30_Geschlecht = 2 WEIGHT_BevRep= 0.540852.
IF Alter_bevölk=2 and q30_Geschlecht =1 WEIGHT_BevRep= 0.433730.
IF Alter_bevölk=2 and q30_Geschlecht =2 WEIGHT_BevRep= 0.554297.
IF Alter_bevölk=3 and q30_Geschlecht =1 WEIGHT_BevRep=0.358310.
IF Alter_bevölk=3 and q30_Geschlecht =2 WEIGHT_BevRep= 0.354128.
IF Alter_bevölk=4 and q30_Geschlecht =1 WEIGHT_BevRep= 0.522777.
IF Alter_bevölk=4 and q30_Geschlecht =2 WEIGHT_BevRep= 0.446539.
IF Alter_bevölk=5 and q30_Geschlecht =1 WEIGHT_BevRep= 0.366775.
IF Alter_bevölk=5 and q30_Geschlecht =2 WEIGHT_BevRep= 0.357564.
IF Alter_bevölk=6 and q30_Geschlecht =1 WEIGHT_BevRep= 0.803511.
IF Alter_bevölk=6 and q30_Geschlecht =2 WEIGHT_BevRep= 1.687959.
Execute.
Wenn ich den Datensatz gewichte, verändern sich die prozentuale Verhältnisse nur im geringen Maß, aber meine Fallzahl halbiert sich beinah:
ungewichtet:
gewichtet:
Da ich noch überhaupt keine Erfahrungen mit Datensatz gewichten habe, mein Prof. aber unbedingt einen gewichteten Datensatz möchte, bin ich gerade etwas am verzweifeln. Warum verändert sich die Fallzahl so stark und ist das für die weitere Analyse von Bedeutung, wenn die Verhältnisse trotzdem stimmen?