Wie Daten auf Repräsentativität testen?

Univariate Statistik.

Wie Daten auf Repräsentativität testen?

Beitragvon conny2 » So 11. Sep 2011, 02:48

Hallo Zusammen,

ich habe per Umfrage rund 2000 Fragebögen erhoben mit jeweils ca 40 Variablen wie Alter, Geschlecht, Bildung, Einstellung zu zB Fastfood (5er Skala "Esse gerne" bis "Esse gar nicht") und möchte in einem ersten Schritt untersuchen, ob die Ergebnisse aus der Umfrage=Stichprobe repräsentativ sind für Deutschland=Grundgesamtheit.

Wollte dies anhand Mittelwerte und T-test machen, nur leider sind die einzelnen Variablen fast alle nicht normalverteilt. Hatte gelesen, dass man dann den U-Test nimmt, in SPSS finde ich diesen jedoch nur für Gruppenvergleiche. Kann jemand helfen? Und wie überprüfe ich die Repräsentativität bei den Variablen, wo ein Mittelwert keinen Sinn (nominale Varibalen) macht?

Vielen Dank schon mal

Conny
conny2
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 11. Sep 2011, 02:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie Daten auf Repräsentativität testen?

Beitragvon strukturmarionette » So 11. Sep 2011, 08:36

Hi,

eine Repräsentativität resultiert m.W. aus der Art und Weise, wie die Daten erhoben worden sind. Also im Vorfeld bzw. während einer Befragung. Diesbezüglich existieren unterschiedliche Stichprobenverfahren (Das Konzept der Zufallsstichprobe ist u.a. wichtig). Einen Test im Nachhinein kenne ich nicht. Ich kann aber nicht aussschließen, dass es so etwas gibt.

S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Wie Daten auf Repräsentativität testen?

Beitragvon PonderStibbons » So 11. Sep 2011, 11:10

Zumindest die Struktur der Stichprobe kann man betrachten. Für soziodemografische Merkmale wie Alter, Geschlecht, Bildung und dergleichen gibt es Angaben über die Verteilung in Deutschland insgesamt (e.g. vom statistischen Bundesamt). Damit lassen sich die Stichprobendaten vergleichen. Formale Tests sind für die Beurteilung der Repräsentativität meines Wissens nach überflüssig, es geht nicht um die inferenzstatistische Entscheidung "Abweichung vorliegend ja/nein" (die ist bei eine großen Stichprobe n=2000 sehr schnell mit "ja" beantwortet), sondern um das Ausmaß der Abweichung. Über die gibt ein inferenzstatistischer Test keine Auskunft. Nebenbei ist Normalverteilung für einen t-Test nur bei kleinen Stichproben relevant. Und Merkmale wie Geschlecht sind ohnedies nicht mit einem t-Test analysierbar.

Gruß

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Wie Daten auf Repräsentativität testen?

Beitragvon conny2 » So 11. Sep 2011, 20:35

Vielen Dank schon mal für die Antworten. War übrigens eine Online-umfrage und Einkaufsstraße. Eins versteh ich jetzt noch nicht so ganz: Wenn ich nun also eine Aussage treffen möchte wie "58% der Deutschen essen gerne Fastfood" (5er Skala "Esse gerne" bis "Esse gar nicht"), brauche ich also nur die Häufigkeiten wiedergeben? Ich dachte, genau dafür wären statistische Tests da. Wenn ich zeigen will, ob zB. Gruppenunterschiede nicht nur in der Stichprobe sondern auch in der Grundgesamtheit vorkommen: a la übergewichtige Menschen essen lieber Fastfood als schlanke Menschen, dann bemühe ich doch auch einen Test.

Und wofür gibt es denn dann den T-Test für eine normalverteilte Stichprobe? Im Statistikbuch hatte ich gelesen: it einem einfachen t-test können Sie auf Basis der Ergebnisse einer Stichprobe Rückschlüsse auf den Mittelwert einer Variablen in der Grundgesamtheit ziehen. Hmmm... genau das wollte ich ja eigtl auch machen, nur dass 1. meine Variablen nicht normalverteilt sind und 2. ich nicht nur intervallskalierte habe. Besten Dank schon mal für Eure Hilfe
conny2
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 11. Sep 2011, 02:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Wie Daten auf Repräsentativität testen?

Beitragvon PonderStibbons » Mo 12. Sep 2011, 08:19

Wenn ich nun also eine Aussage treffen möchte wie "58% der Deutschen essen gerne Fastfood" (5er Skala "Esse gerne" bis "Esse gar nicht"), brauche ich also nur die Häufigkeiten wiedergeben? Ich dachte, genau dafür wären statistische Tests da. Wenn ich zeigen will, ob zB. Gruppenunterschiede nicht nur in der Stichprobe sondern auch in der Grundgesamtheit vorkommen: a la übergewichtige Menschen essen lieber Fastfood als schlanke Menschen, dann bemühe ich doch auch einen Test.

Das sind zwei unterscheidliche Themen. Das erste ist eine deskriptive Aussage. Was aber willst Du denn testen, wenn Du ermittelt hast, dass X% der Stichprobe dieses oder jenes mögen? Da kannst Du ein Konfidenzintervall berechenen und gut ist's.

Allerdings Angaben aus einer Straßen- und Onlinebfragung so zu beschreiben, als wären diese repräsentativ für alle Deutschen (wieso übrigens auf einmal nur die Deutschen? in der ursprünglichen Frage ging es um Deutschland, das wären gemeinhin die Bewohner des Landes, nicht nur die Staatsangehörigen), klingt etwas kühn.

Aber wie auch immer, zu testen ist da für sich genommen nichts.

Zusammenhangshypothesen wie die zweite Hypothese kann man selbstverständlich inferenzstatistisch testen.

Und wofür gibt es denn dann den T-Test für eine normalverteilte Stichprobe? Im Statistikbuch hatte ich gelesen: it einem einfachen t-test können Sie auf Basis der Ergebnisse einer Stichprobe Rückschlüsse auf den Mittelwert einer Variablen in der Grundgesamtheit ziehen.

t-Tests mit kleinen Stichproben (< 50) erfordern, dass die einzelnen Gruppen aus normalverteilten Grundgesamtheiten stammen. Bei größeren Stichproben eben nicht.

Gruß

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

Re: Wie Daten auf Repräsentativität testen?

Beitragvon conny2 » Mo 12. Sep 2011, 11:11

Hmmm...das mit dem Konfidenzintervall hört sich nach dem an, was ich machen möchte. Wenn ich mich nicht täusche, wäre dann also eine Aussage damit möglich a la "Mit einer Vertrauenswahrscheinlichkeit von 99,9% liegt der Mittelwert in der Stichprobe von 2,9 auch in der Grundgesamtheit mit plus minus 0,25 vor"?

Bei normalverteilten Variablen würde ich den t-Test machen. Und kann ich Deine letzte Aussage so verstehen: Zwar sind meine Variablen nicht normalverteilt, aber aufgrund meiner Stichprobengröße kann ich dennoch den T-Test machen?
conny2
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: So 11. Sep 2011, 02:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Mittelwert, Standardabweichung & Co.

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron