Hallo liebe Statistik Community!
Ich habe einen Datensatz voller Mobilitätsdaten. Ich soll nun die Varianz & Standardabweichung der mittleren Anzahl an zurückgelegten Wegen pro Person berechnen. Um auf die Grundgesamtheit hochrechnen zu können gibt es für jede Datenzeile meiner Stichprobe einen Hochrechnungs-/Gewichtungsfaktor.
Normalerweise berechnet sich die Varianz ja wie folgt:
Soweit so gut aber wie kann ich jetzt die Varianz inklusive der Gewichte berechnen. Das gewichtete Mittel ist auch kein Problem:
Doch kann ich nicht einfach mein gewichtetes Mittel in die Formel der Varianz einsetzen, da ansonsten die Werte xi nicht gewichtet sind und daher ein flasches Ergebnis liefern. Ich weiß leider nicht wie ich hier vorgehen soll bzw. welche Formel anzuwenden. Bisher wurde ich im Internet leider auch nicht fündig...
Mein Datenset sieht in etwa so aus:
Die Wegeanzahl entspricht also meinem Xi und der Hochrechnungsfaktor entspricht meinem Gewicht Wi. Die Summe aller Hochrechnungsfaktoren entspricht der Anzahl in meiner Grundgesamtheit. In diesem Fall alle Einwohner dieses Landes.
Also wie kann ich hier die korrekte Varianz berechnen, also unter Einbeziehung der Hochrechungs-/Gewichtungsfaktoren?