![Lächeln :)](http://www.statistik-forum.de/images/smilies/icon_e_smile.gif)
Ich habe wirklich ein Problem damit zu verstehen, wann eine Stichprobe als repräsentativ gilt. Ich lese immer wieder "sollte nicht systematisch von der Grundgesamtheit abweichen". Aber ab wann gilt die Abweichung als systematisch?
Ich habe eine Befragung durchgeführt mit der ich Aussagen über Studierende in Deutschland und in Ungarn treffen möchte (2 Stichproben).
Anbei mal für Deutschland ein paar Daten
Grundgesamtheit Deutschland: 2.479.448 Studierende, davon 49,71% weiblich. Median des Alters: 23,2 Jahre
Stichprobe Deutschland: 490 Fälle, davon 64,9% weiblich. Median des Alters: 26 Jahre.
Der Fragebogen wurde in seeehr vielen Facebook Gruppen, auf LinkedIn, Xing und in einem Stipendiatennetzwerk verteilt. - durch Corona sollte sowieso jeder Student Internet haben, aber klar nicht jeder ist in den entsprechenden Gruppen... Innerhalb des Verteilers hat aber jeder die gleiche Chance, in die Stichprobe zu kommen.
Wo zieht man hier die Grenze zur Repräsentativität? Klar entspricht es nicht genau der Grundgesamtheit, aber wie will das überhaupt jemandhinkriegen? Werden dann einfach (mit genug Geld) 5.000 Leute befragt und munter Fälle aussortiert, bis es irgendwann passt? Dann sind die ja auch nicht so wirklich zufällig in der Stichprobe bzw. wurden einige *unzufällig* entfernt. Und damit jeder die gleiche Chance hätte müsste man ja die Adressen aller Studierenden haben und dann mittels irgendeines Losverfahrens auslosen, wen man anschreibt. Das ist doch gar nicht möglich oder?
Viele Grüße[/size]