Hallo zusammen,
Mir wurde vor kurzem die Frage gestellt, ob es ein statistisches Verfahren gibt, mit dessen Hilfe es möglich ist, einen Zusammenhang zwischen zwei Variablen zu berechnen, die bei unterschiedlichen (und unterschiedlich großen) Stichproben erhoben wurden, wenn keine eindeutige Paarung der Daten vorliegt.
Beispiel A:
Stichprobe 1 --> Beschäftigte eines Supermarktes (n=300)
Stichprobe 2 --> Kunden eines Supermarktes (n=100)
Variable 1 --> Allgemeine Arbeitszufriedenheit (wird nur bei den Beschäftigten erhoben)
Variable 2 --> Kundenzufriedenheit (wird nur bei den Kunden erhoben)
Die Hypothese, die getestet werden soll, ist:
Die allgemeine Arbeitszufriedenheit der Beschäftigten hängt positiv mit der Zufriedenheit der Kunden zusammen.
Weil z.B. bei der Messung aus rechtlichen Gründen nicht miterhoben wurde, mit welchen Beschäftigten die Kunden genau Kontakt hatten, ist eine eineindeutige Zuordnung der Kunden zu den Beschäftigten nicht möglich
d.h. es liegen keine Datenpaare der Form (Zufriedenheit von Beschäftigtem Xi; Zufriedenheit von Kunde Yi) vor
Kennt jemand ein Verfahren (ggf. auch komplexere Verfahren wie Strukturgleichungsmodelle etc.), mit dessen Hilfe diese Fragestellung beantwortet werden könnte?
Meine erste Intuition ist, dass eine solche Fragestellung (zumindest mit den statistischen Standardverfahren) nicht beantwortet werden kann, weil die Daten zu den Variablen ja in irgendeiner Form logisch miteinander in Bezug gesetzt werden müssen.
Falls ihr derselben Ansicht seid, hier noch eine Folgefrage zu einem leicht abgewandelten Alternativszenario:
Angenommen, es läge zumindest eine gruppenweise Zuordnung der Beschäftigten zu den Kunden vor d.h. einem Kunden könnte jeweils eine Gruppe von Beschäftigten (z.B. alle anwesenden Mitarbeiter einer Schicht) zugeordnet werden. Gäbe es dann ein passendes Verfahren, wenn bestimmte Einschränkungen* (s.u.) vorliegen?
Beispiel A':
Kunde 1 --> Beschäftigter 1, Beschäftigter 2, Beschäftigter 4
Kunde 2 --> Beschäftigter 3, Beschäftigter 5
Kunde 3 --> Beschäftigter 1, Beschäftigter 4, Beschäftigter 5, Beschäftigter 6
...
*Einschränkungen:
1) Die Beschäftigtengruppen sind nicht gleich groß.
2) Es gibt sehr viele verschiedene Kombinationen von Beschäftigten in den Gruppen
(d.h. es gibt zu viele Zellen für eine Varianzanalyse)
Mir würde bei diesem zweiten Szenario nur noch einfallen, (trotz der unterschiedlichen Gruppengrößen) jeweils den Mittelwert über die Beschäftigten für jeden Kunden zu nehmen und dann eine einfache Korrelation (z.B. Pearson) zwischen den Kundenwerten und den Mittelwerten zu berechnen.
Ich hoffe, dass ich meine Fragestellung nachvollziehbar darstellen könnte und würde mich über ein kurzes Feedback freuen.
Vielen Dank für eure Hilfe!
LG Jörg