Hallo,
ich beschäftige mich gerade mit den häufig vorausgesetzten Zufallsstichproben sowie möglichen Folgen, die sich aus einer nicht-zufällig gezogenen Stichprobe ergeben. Vielen empirischen Studien liegen Stichproben zu Grunde, auf deren Basis ja Rückschlüsse auf eine entsprechende Population gewonnen werden sollen. In diesem Zusammenhang wird häufig auf die Wichtigkeit einer Zufallsstichprobe hingewiesen. Dazu habe ich ein paar Fragen:
1.) Sofern ich es richtig verstanden habe, hat in einer Zufallsstichprobe jedes Element der interessierenden Grundgesamtheit eine positive Wahrscheinlichkeit in die Stichprobe aufgenommen zu werden.
Angenommen ich führe ein Experiment durch, bei dem ich den Effekt eines Werbespots auf das Kaufverhalten einer Person untersuchen möchte (frei gewähltes Beispiel). Nehmen wir mal an, dass das Studiendesign eine Kontroll- und eine Treatmentgruppe vorsieht. Die Treatmentgruppe bekommt einen bestimmten Werbespot vor einem Einkaufsgang zu sehen und die Kontrollgruppe bekommt diesen nicht zu sehen.
Grundsätzlich kann es doch hier mit Bezug auf die Stichprobenauswahl an zwei Punkten zu "Ergebnisverzerrungen" kommen: Die Population, auf die ich die Ergebnisse beziehen möchte, ergibt sich meines Verständnis nach zwangsläufig aus der Zusammensetzung meiner Stichprobe: Angenommen ich suche mir als Ort zur Probantenauswahl einen Supermarkt nahe einer Uni aus, wo die Kundschaft zu 70% aus Studenten besteht. Nun wähle ich zufällig 100 Menschen vor ihrem Einkauf aus und teile sie anschließend in zwei Gruppen ein. Wäre mein Ziel etwas über den Effekt des Videospots auf den "Durchschnittsdeutschen", d.h. mit Bezug auf die Population aller deutschen Bürger zu erfahren, wären meine Ergebnisse doch mitunter bereits an dieser Stelle verzerrt, da es eben sehr viel wahrscheinlicher ist einen Studenten in meiner Stichprobe zu haben? Nun ist es vielleicht nicht ganz unplausibel, dass der Effekt eines Werbespots anders auf Studenten wirkt als auf einen nicht-Studenten. Entsprechend leidet darunter doch die externe Validität meiner Erkenntnisse, sodass ich diese im schlimmsten Fall nur auf eine weitaus kleinere Population übertragen kann (die Population aller Studenten in der Stadt).
Im nächsten Schritt muss ich die Teilnehmer der Stichprobe der Treatment bzw. der Kontrollgruppe zuweisen. Auch diese Zuweisung muss zufällig erfolgen, um eine Verzerrung der Ergebnisse zu vermeiden. Andernfalls kann es ja passieren, dass ich in einer der zwei Gruppen einen Einfluss "einbaue", der mitunter einen systematischen Effekt auf die interessierende Variable hat.
In einem Tutorium haben wir - um sicherzustellen, dass die Randomisierung der Gruppen funktioniert hat - dazu immer sogenannte Tests of Balance durchgeführt. Damit wird bspw. mit Hilfe eines zweistichproben t-tests geprüft, ob sich die Mittelwerte von beobachtbaren Merkmalen (Alter, Geschlecht etc.) in den beiden Gruppen (Kontrollgruppe und Treatmentgruppe) signifikant voneinander unterscheiden. Nun habe ich bereits in einigen gelesen, dass diese Tests überflüssig sind, wenn man sicherstellen konnte, dass die Zuweisung zu den zwei Gruppen zufällig passierte. Bspw. hier: https://janhove.github.io/reporting/201 ... ance-tests
Dazu würde ich gerne einmal eure Meinung hören. Was wäre dann gemäß dem Fall zu tun, dass ein solcher Test einen signifikanten Unterschied bei einem beobachtbaren Merkmal feststellt? Im Endeffekt ist damit ja noch nicht gesagt, dass ein Unterschied bei einem bestimmten Merkmal auch einen Verzerrungseffekt bei der interessierenden Variable hervorruft.
Ich freue mich auf eure Antworten