bele hat geschrieben:Hallo Leviathan,
wenn innerhalb jeder Klasse eine symmetrische Verteilung um die Klassenmitte vorliegt, beispielsweise eine Gleichverteilung, dann ist innerhalb jeder Klasse der Mittelwert von vielen Personen die Klassenmitte. Deshalb habe ich gefragt, wofür Du das brauchst: Wenn Du eine große Zahl von Leuten hast und deren Mittelwert mit einem ordentlichen Maß an Unsicherheit abschätzen willst, dann wäre das der richtige Weg.
Wenn Du das pro Person und nicht als Mittelwert von vielen machen willst, dann kannst Du das eben nicht.
Davon abgesehen ist die Annahme von Gleichverteilung innerhalb der Gruppen recht weit hergeholt. Beispiel "Geringfügige Beschäftigung": Wer unter 450 EUR verdient zahlt keine Sozialabgaben, wer darüber verdient zahlt volle Abgaben. Also schreiben viele Arbeitgeber Stellen explizit als Minijob aus mit der Maßgabe, unterhalb von 450 EUR zu bleiben. Solche Stufeneffekte wird es noch an anderen Stellen geben und deshalb ist die Gleichverteilung eine unrealistische Annahme, die man für grobe Schätzungen sicher mal treffen kann, die aber nicht "das Einkommen des Beschäftigten" (im Singular!) präzise bestimmt.
LG,
Bernhard
So habe ich mir das im Prinzip schon gedacht.
Und das Problem liegt ja darin, dass ich
keine Informationen über die Verteilung habe, sondern es sich ja lediglich um kategoriale Variablen handelt, bei denen angegeben wird, wer welches einkommen in welcher Klasse hat.
Meine Alternativvorgehensweise wäre jetzt: Entweder arbeite ich nur mir dem "monatlichen Grhalt / Einkommen" (in der jeweiligen Vorgängervariable wird das angegeben; da müsste ich einen Filter setzen) oder ich bilde eine neue Variable aus dem höchsten verfügbaren Einkommen: Ob das nun die Rente ist, das Gehalt oder Arbeitslosengeld.
Welche Methode empfielt sich hier?