Zufallsauswahl bei unbekannter u. sortierter Grundgesamtheit

Fragen, die sich auf kein spezielles Verfahren beziehen.

Zufallsauswahl bei unbekannter u. sortierter Grundgesamtheit

Beitragvon Rummbolt » So 4. Sep 2016, 20:36

Hallo zusammen!

Wenn ich in dieses Forum schaue, scheinen hier ja echt viele Verzweifelte Rat zu suchen... Nun, das betrifft jetzt auch mich!

Ich bin Felix und studiere im sechsten Semester Sozialwissenschaften. Aktuell bin ich mit meiner Bachelor-Arbeit beschäftigt. Und genau hier liegt mein Problem.

Ich möchte eine quantitative Inhaltsanalyse von Profilbildern im Online-Dating vornehmen. Die Hypothesen stehen, ich weiß auch prinzipiell wie ich vorgehen will. ABER:

Die Fallauswahl bereitet mir massive Probleme!
Die ganze Arbeit ist quantitativ aufgezogen, und damit am Ende meine Daten reliabel sind, muss ich bei meinen Fällen eine Zufallsauswahl treffen. Willkürliche Auswahlverfahren lassen ja bekanntlich keine mathematisch-statistischen Aussagen zu.

Die Profile auf den Online-Dating Plattformen lassen sich allerdings nicht zufällig ausgeben. Es hängen immer irgendwelche Sortier-Mechanismen dahinter, z.b. ein bestimmter Ort, aus dem die Profile kommen, oder die vom Portal suggerierte "Partnerschaftseignung" - jedenfalls kein Zufall! Außerdem ist nicht ersichtlich, wie viele Profile die Ausgabeliste beinhaltet.

Kennt Ihr vielleicht eine Möglichkeit, aus dieser Liste quasi im Nachhinein eine 100%ig zufällige Auswahl zu treffen?
Habe schon an eine mehrstufige Zufallsauswahl gedacht, in der ich erst aus einer Liste aller Deutschen Städte mittels Excelbefehl eine zufällig aussprucken lasse (Schritt 1 ) Dann gebe ich diese Stadt in der Suchmaske der Dating-Plattform ein. Die Liste umfasst jetzt nur noch Nutzer aus dieser Stadt. Dennoch ist die Sortierlogik der Ausgabelite nicht transparent , und es haben nicht alle Nutzer die gleiche Chance, in die Stichprobe zu gelangen, da einige nunmal oben stehen, und andere unten.
Stufe Zwei wäre dann, den Nutzer auszuwählen, der zuletzt online war ( Vgl. mit Telefon-Interviews "Ich würde gern mit dem Familienmitglied sprechen, das zuletzt geburtstag hatte" ). Aber das schmälert die Chancen inaktiverer User, in die Stichprobe zu kommen!

Das ist ja so dermaßen komplex, mit sowas hätte ich nieeemals gerechnet...

Ich hoffe ihr blickt durch den Sachverhalt durch - und vielleicht weiß ja tatsächlich jemand Rat :)

Liebe Grüße, und schönen Sonntag Abend

Euer Felix
Rummbolt
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 4. Sep 2016, 20:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Zufallsauswahl bei unbekannter u. sortierter Grundgesamt

Beitragvon PonderStibbons » So 4. Sep 2016, 21:20

Die ganze Arbeit ist quantitativ aufgezogen, und damit am Ende meine Daten reliabel sind, muss ich bei meinen Fällen eine Zufallsauswahl treffen.

Du meinst vielleicht valide?

Gleichviel, man "muss" nicht eine Zufallsauswahl treffen (wie auch immer definiert),
auch wenn's manchmal nützlich ist/wäre.

Die Art und Weise der Stichprobenziehung/-rekrutierung definiert, über welche
Populationen man Aussagen inferieren kann, und über welche womöglich nicht.

Willkürliche Auswahlverfahren lassen ja bekanntlich keine mathematisch-statistischen Aussagen zu.

Das wäre mir neu.

Das ist ja so dermaßen komplex, mit sowas hätte ich nieeemals gerechnet...

Vor allem ziemlich spezifisch, ich verstehe Deine Beschreibung nicht. Dementsprechend
leider auch nicht, wo jetzt eigentlich der Schuh drückt.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Zufallsauswahl bei unbekannter u. sortierter Grundgesamt

Beitragvon Rummbolt » Mo 5. Sep 2016, 15:23

Hallo PonderStibbons,

Vielen Dank schon mal, dass Du Dich meinem Problem annehmen möchtest :) :)

Ich hole jetzt etwas weiter aus, um den Sachverhalt verständlicher darzustellen.

In meiner Bachelorarbeit möchte ich die Zusammenhänge sozialer Gruppenzugehörigkeiten (Alter, Geschlecht, Bildungsniveau, Beziehungsstatus)
mit Elementen der strategischen Selbstdarstellung in Profilbildern beim Online-Dating (Foto-Perspektive, Freizügigkeit, Abbildung von Statussymbolen, Gruppen-Fotos Vs. Einzelaufnahmen)
analysieren.

Dazu möchte ich insgesamt 400 Profile heterosexueller Menschen zwischen 18 und 99 Jahren operationalisieren und durchcodieren. Alles kein Problem.

Aber:
Ich muss an diese Profile ja irgendwie ran kommen.

Die zu untersuchenden Partnerbörsen sind lovoo.com und lovescout24.de

Innerhalb dieser Plattformen gibt es jeweils eine Suchfunktion, mit der sich bestimmte Profile ausgeben lassen. Diese Funktion ist gekoppelt an verschiedene Suchparameter. So können z.B. Nutzer aus dem regionalen Umkreis gesucht werden, ein bestimmtes Alter und Geschlecht kann "gesucht" werden.
Es gibt allerdings KEINE Möglichkeit, sich zufällig BELIEBIGE Profile ausgeben zu lassen. Die "breiteste" Sucheintellung sieht wie folgt aus:

1. Eine fix eingestellte Stadt, aus der die Profile kommen, incl ein geringer Umkreis von ca 5 Km.
2.Beide Geschlechter (Bei eigenem männlichen Profil dann Homo-oder Bi-Sexuelle Männer.)
3.Das Alter der Personen hinter den Profilen bewegt sich + - 10 Jahre um das eigene Profil"Alter", das eine verpflichtende Angabe ist.
4. Die nach diesen "lockeren" Parametern zusammengestellte Liste unterliegt einer Reihenfolge, in der die Profile von oben nach unten gelistet sind. Die Logik hinter dieser Sortierung wird nirgendwo angegeben, und ist auch nicht transparent. Ich VERMUTE, sie hat etwas mit der Entfernung des jeweiligen Profils zum Zentrum der ausgewählten Stadt (1.) zu tun.



Ich möchte allerdings gerne meine Hypothesen mit Gültigkeit für möglichst alle Deutschen Online-Dater bestätigen bzw. falsifizieren. Meines Wissens benötige ich dazu allerdings eine Zufallsauswahl, bei der ich auch die Grundgesamtheit der möglichen Fälle kenne, und alle Profil"kandidaten" die gleiche Chance haben, in die Stichprobe zu kommen.

Ich versuche, die drei von den Partnerbörsen vorgegebenen "Suchparameter" irgendwie nachträglich so gut wie möglich zu randomisieren.

Zu 1. : Ich lasse via Excel eine zufällige Deutsche Stadt ausgeben. Ich habe eine Tabelle aller Deutschen Städte des statistischen Bundesamtes vorliegen, aus der ich einfach zufällig eine auswähle. Läuft über den einfachen Befehl "=INDEX(D9:D11300;ZUFALLSBEREICH(1;11300))" -> Somit habe ich die Stadt randomisiert.

Zu 2. : Ich lege ein Profil je Geschlecht an, und suche nur nach dem jeweils anderen Geschlecht. Somit erhalte ich nur heterosexuelle Profile, mit einigen bisexuellen Ausnahmen, die in der Arbeit nicht analysiert werden. Letztere werden dann übergangen.

Zu 3.: Hier habe ich bis jetzt keine Lösung gefunden. Stelle ich mein eigenes Alter auf 30 ein, bekomme ich Profile von 20 bis 40 Jährigen (ca.), bei eigenem Alter 60 werden Profile zw. 50 und 70 ausgespuckt. Man KÖNNTE jetzt 6 Profile anlegen, (Alter 30, 50,80) x 2 wegen Männlich/ weiblich. Und dann jeweils 67 Profile codieren (N400 durch 6 = 66,666). Die müssten dann aber wiederum auf beide Portale (lovoo & lovescout) gesplittet werden, im Zweifelsfall wären dann 12 Profile nötig, von denen aus dann jeweils 34 Profile codiert würden. Hier liegt letztendlich so ein bisschen der Hase im Pfeffer.

Zu 4.: Die intransparente Listenreihenfolge, die eben NICHT zufällig ist, wollte ich mit einer weiteren Zufallsebene entschärfen. Es soll pro Liste immer das erste Profil ausgewählt werden, das, von Beginn der Liste oben prüfend, zuletzt online war bzw. gerade ist. Problem: Damit hat die Listenreihenfolge immernoch eine gewisse Relevanz, da ich einen Ausgangspunkt in der Liste haben muss, von dem aus ich den Online-Status der Profile überprüfen kann. Da eignet sich der Anfang oben nunmal aus Bequemlichkeit am besten, aber ansonsten ist jeder Punkt der Liste ja eigentlich gleich gut geeignet - die Logik der Sortierung ist ja wie gesagt nicht bekannt. Als weiteres Problem räume ich mit diesem Vorgehen solchen Nutzern eine höhere Wahrscheinlichkeit ein, in die Stichprobe zu kommen, die die Partnerbörse aktiv nutzen und oft online ist, als anderen, die "nur einmal die Woche" vorbei schauen.

Wenn ich dieser vier Kriterien überwinden kann, habe ich meiner Meinung nach eine schöne Zufallsauswahl erreicht, Punkt 1 und 2 sind ja de facto schon gelöst.
Abr an 3. und 4. zerbreche ich mir schon seit Tagen den Kopf.

Alternativ könnte ich auf eine Zufallsauswahl verzichten, eine Stadt mit ~ 200 Usern pro Partnerbörse auswählen, und einfach ALLE Profile codieren.
Dann wären meine Aussagen zu den Hypothesen zwar nicht mehr für alle deutschen Nutzer valide (Danke Für den Hinweis ;) ) , aber immerhin bin ich dann das Problem mit der Zufallsauswahl los. Das würde allerdings ein partielles Umschreiben der bisherigen Arbeit (Theorie, Hypothesen, Forschungsstand...) erfordern.

Es würde mich sehr freuen, wenn Du, lieber PonderStibbons, oder weitere Mitleser hier eine Idee zur Lösung, oder aber eine Alternative parat hätten.

Vielen vielen Dank, dass Du Dich, und dass Ihr euch mit meinem Problem befasst.
Ich bin weder ein großer Statistiker, noch großer Empiriker, aber jetzt habe ich mir meinen Analysegegenstand nunmal so zusammengeschustert und muss da irgendwie durch :D

Viele liebe Grüße

Felix
Rummbolt
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: So 4. Sep 2016, 20:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Zufallsauswahl bei unbekannter u. sortierter Grundgesamt

Beitragvon PonderStibbons » Di 6. Sep 2016, 10:15

Ja. das ist nun leider sehr spezifisch. Die beiden Firmen hast Du nicht
kontaktiert, ob sie Profile per Zufallsauswahl zur Verfügung stellen?

Und auf den Seiten gibt es keine Möglichkeit, die neuesten Profile
(ungefiltert) einzusehen, etwas in der Art von "die neuesten Mitglieder"?
Die wären zwar nicht repräsentativ für alle Mitglieder, aber nach
einiger Zeit hätte man eine ungefilterte Gruppe zusammen.

Mit freundlichen Grüßen

Ponderstibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 19 Gäste