Guten Tag allerseits,
auf die Gefahr hin, hier völlig falsch zu sein (zu welchen Verfahren gehört pyramid sampling?) wage ich mich trotzdem mit meiner Frage heran. Und zwar beschäftige ich mich gerade mit Untersuchungen des United Nations Development Programme zu Roma-Communities. Diesen Gruppen wird nachgesagt, ihre Identität häufig nicht offen zu bekennen, weshalb das Sampling der Studie wohl eine ziemliche Herausforderung darstellte. Das Vorgehen wird nun folgendermaßen beschrieben:
In most countries, therefore, Roma are underreported in censuses, and officially registered sizes of Roma populations often differ dramatically from experts’ estimates.
While accepting the belief that censuses understate the absolute numbers of Roma, the survey accepted that the census data provide reasonably adequate pictures of the structure and territorial distribution of those individuals who identify themselves as Roma. Since the absolute number of Roma populations is not known, random sampling was not possible, so a ‘pyramid’ sampling model was used instead. Within this model, various estimates of Roma population (including census data) constitute different tiers of the pyramid. The bottom of the pyramid constitutes the total (‘real’) number of Roma in a country. The top represents the hypothetical situation of total exclusion in which not a single person would self-identify as Roma. Census data constitute one of the pyramid’s tiers, with the pyramid’s strata reflecting the structure of the population. Under this model, if the ‘propensity to underreport’ (i.e., the share of Roma not willing to identify themselves as Roma) is distributed similarly in different regions within a country, the structure of the population reflected in the census tier would be identical to the structure of the total population. This should be sufficiently unbiased to construct a representative stratified sample.
Den ersten Satz versteh ich noch aber dann... Bahnhof. Wie kommt man auf die "propensity to underreport"? Wird hier wirklich die geschätzte Zahl herangezogen und mit der Verteilung aus der Volkszählung kombiniert?
Mir erscheint das nicht als seriöse Vorgehensweise, gerade weil die Diskussion um die Anzahl der Angehörigen von Roma-Communities eine recht kontroversielle ist, und zudem nicht offengelegt wird, worauf diese Schätzungen denn eigentlich beruhen.
Oder irre ich mich? Es wäre wirklich super, wenn mir jemand helfen und eine Einschätzugn geben könnte!