Hallo PonderStibbons,
Vielen Dank schon mal, dass Du Dich meinem Problem annehmen möchtest
Ich hole jetzt etwas weiter aus, um den Sachverhalt verständlicher darzustellen.
In meiner Bachelorarbeit möchte ich die Zusammenhänge sozialer Gruppenzugehörigkeiten (Alter, Geschlecht, Bildungsniveau, Beziehungsstatus)
mit Elementen der strategischen Selbstdarstellung in Profilbildern beim Online-Dating (Foto-Perspektive, Freizügigkeit, Abbildung von Statussymbolen, Gruppen-Fotos Vs. Einzelaufnahmen)
analysieren.
Dazu möchte ich insgesamt 400 Profile heterosexueller Menschen zwischen 18 und 99 Jahren operationalisieren und durchcodieren. Alles kein Problem.
Aber:
Ich muss an diese Profile ja irgendwie ran kommen.
Die zu untersuchenden Partnerbörsen sind lovoo.com und lovescout24.de
Innerhalb dieser Plattformen gibt es jeweils eine Suchfunktion, mit der sich bestimmte Profile ausgeben lassen. Diese Funktion ist gekoppelt an verschiedene
Suchparameter. So können z.B. Nutzer aus dem regionalen Umkreis gesucht werden, ein bestimmtes Alter und Geschlecht kann "gesucht" werden.
Es gibt allerdings KEINE Möglichkeit, sich zufällig BELIEBIGE Profile ausgeben zu lassen. Die "breiteste" Sucheintellung sieht wie folgt aus:
1. Eine fix eingestellte Stadt, aus der die Profile kommen, incl ein geringer Umkreis von ca 5 Km.
2.Beide Geschlechter (Bei eigenem männlichen Profil dann Homo-oder Bi-Sexuelle Männer.)
3.Das Alter der Personen hinter den Profilen bewegt sich + - 10 Jahre um das eigene Profil"Alter", das eine verpflichtende Angabe ist.
4. Die nach diesen "lockeren" Parametern zusammengestellte Liste unterliegt einer Reihenfolge, in der die Profile von oben nach unten gelistet sind. Die Logik hinter dieser Sortierung wird nirgendwo angegeben, und ist auch nicht transparent. Ich VERMUTE, sie hat etwas mit der Entfernung des jeweiligen Profils zum Zentrum der ausgewählten Stadt (1.) zu tun.
Ich möchte allerdings gerne meine Hypothesen mit Gültigkeit für möglichst alle Deutschen Online-Dater bestätigen bzw. falsifizieren. Meines Wissens benötige ich dazu allerdings eine Zufallsauswahl, bei der ich auch die Grundgesamtheit der möglichen Fälle kenne, und alle Profil"kandidaten" die gleiche Chance haben, in die Stichprobe zu kommen.
Ich versuche, die drei von den Partnerbörsen vorgegebenen "Suchparameter" irgendwie nachträglich so gut wie möglich zu randomisieren.
Zu 1. : Ich lasse via Excel eine zufällige Deutsche Stadt ausgeben. Ich habe eine Tabelle aller Deutschen Städte des statistischen Bundesamtes vorliegen, aus der ich einfach zufällig eine auswähle. Läuft über den einfachen Befehl "=INDEX(D9:D11300;ZUFALLSBEREICH(1;11300))" -> Somit habe ich die Stadt randomisiert.
Zu 2. : Ich lege ein Profil je Geschlecht an, und suche nur nach dem jeweils anderen Geschlecht. Somit erhalte ich nur heterosexuelle Profile, mit einigen bisexuellen Ausnahmen, die in der Arbeit nicht analysiert werden. Letztere werden dann übergangen.
Zu 3.: Hier habe ich bis jetzt keine Lösung gefunden. Stelle ich mein eigenes Alter auf 30 ein, bekomme ich Profile von 20 bis 40 Jährigen (ca.), bei eigenem Alter 60 werden Profile zw. 50 und 70 ausgespuckt. Man KÖNNTE jetzt 6 Profile anlegen, (Alter 30, 50,80) x 2 wegen Männlich/ weiblich. Und dann jeweils 67 Profile codieren (N400 durch 6 = 66,666). Die müssten dann aber wiederum auf beide Portale (lovoo & lovescout) gesplittet werden, im Zweifelsfall wären dann 12 Profile nötig, von denen aus dann jeweils 34 Profile codiert würden. Hier liegt letztendlich so ein bisschen der Hase im Pfeffer.
Zu 4.: Die intransparente Listenreihenfolge, die eben NICHT zufällig ist, wollte ich mit einer weiteren Zufallsebene entschärfen. Es soll pro Liste immer das erste Profil ausgewählt werden, das, von Beginn der Liste oben prüfend, zuletzt online war bzw. gerade ist. Problem: Damit hat die Listenreihenfolge immernoch eine gewisse Relevanz, da ich einen Ausgangspunkt in der Liste haben muss, von dem aus ich den Online-Status der Profile überprüfen kann. Da eignet sich der Anfang oben nunmal aus Bequemlichkeit am besten, aber ansonsten ist jeder Punkt der Liste ja eigentlich gleich gut geeignet - die Logik der Sortierung ist ja wie gesagt nicht bekannt. Als weiteres Problem räume ich mit diesem Vorgehen solchen Nutzern eine höhere Wahrscheinlichkeit ein, in die Stichprobe zu kommen, die die Partnerbörse aktiv nutzen und oft online ist, als anderen, die "nur einmal die Woche" vorbei schauen.
Wenn ich dieser vier Kriterien überwinden kann, habe ich meiner Meinung nach eine schöne Zufallsauswahl erreicht, Punkt 1 und 2 sind ja de facto schon gelöst.
Abr an 3. und 4. zerbreche ich mir schon seit Tagen den Kopf.
Alternativ könnte ich auf eine Zufallsauswahl verzichten, eine Stadt mit ~ 200 Usern pro Partnerbörse auswählen, und einfach ALLE Profile codieren.
Dann wären meine Aussagen zu den Hypothesen zwar nicht mehr für alle deutschen Nutzer
valide (Danke Für den Hinweis
) , aber immerhin bin ich dann das Problem mit der Zufallsauswahl los. Das würde allerdings ein partielles Umschreiben der bisherigen Arbeit (Theorie, Hypothesen, Forschungsstand...) erfordern.
Es würde mich sehr freuen, wenn Du, lieber PonderStibbons, oder weitere Mitleser hier eine Idee zur Lösung, oder aber eine Alternative parat hätten.
Vielen vielen Dank, dass Du Dich, und dass Ihr euch mit meinem Problem befasst.
Ich bin weder ein großer Statistiker, noch großer Empiriker, aber jetzt habe ich mir meinen Analysegegenstand nunmal so zusammengeschustert und muss da irgendwie durch
Viele liebe Grüße
Felix