Moderator/Regression bei ungleicher Verteilung

Alle Verfahren der Regressionanalyse.

Moderator/Regression bei ungleicher Verteilung

Beitragvon an27 » Fr 9. Dez 2011, 13:04

Hallo,

ich habe ein statistisches Problem und leider immer noch keine richtige Lösung dafür: ich habe eine riesige Stichprobe von ca. 2000 TN und würde gern rechnen, ob bestimmte Variablen als Moderator funktionieren, sprich ob sich die Auswirkungen von bestimmten uVs auf bestimmte aVs in Abhängigkeit von den Moderatorvariablen verändern. Leider ist die Verteilung der besagten Moderatorvariablen so, dass ich meist von den 2000TN ca. 1600TN in einer Gruppe habe und diese starke Gruppe einen schwachen 400TN gegenüber stehen, bei denen ich eine Effekt erwarten würde. Da ich mich nicht so auf diesem Gebiet auskenne, frage ich mich, welche Möglichkeiten man nun hat, um überhaupt Effekte zu finden? Nach meinem Verständnis unterdrück doch die starke Gruppe mit 1600TN jegliche Effekte, oder?
Einfaches Beispiel, ohne zu sehr ins Detail gehen zu wollen: wenn ich Unterschiede zwischen Mann und Frau annehme, aber 1700 Männer und 300 Frauen in meiner Stichprobe habe, wie kann ich dann noch Unterschiedseffekte finden?

Vielen Danke im Voraus
an27
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 9. Dez 2011, 12:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Moderator/Regression bei ungleicher Verteilung

Beitragvon daniel » Fr 9. Dez 2011, 15:08

Hast Du denn schonmal ein Modell geschätzt? Wenn ja, was kam da raus? Wenn nein, tu das zuerst mal bevor Du Dir Gedanken machst, aus welchen methodisch/statistischen Gründen sich eine prognostizierte Interaktion vielleicht nicht zeigen könnte.

Zu der Interaktion hätte ich aber noch eine Verständnisfrage.
Leider ist die Verteilung der besagten Moderatorvariablen so, dass ich meist von den 2000TN ca. 1600TN in einer Gruppe habe und diese starke Gruppe einen schwachen 400TN gegenüber stehen, bei denen ich eine Effekt erwarten würde

Wie kannst Du in einer der Gruppen einen Effekt erwarten? Ich verstehe die Formulierung nicht. Ein Moderatoreffekt, ist ein Unterschied im Effekt eines Prädikators für verschiedene (hier: zwei) Gruppen. Ein Unterschied zwischen zwei Gruppen kann, schon per Defintion, nicht nur für eine Gruppe gelten. Entweder es gibt diesen Unterschied, oder es gibt ihn nicht.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Moderator/Regression bei ungleicher Verteilung

Beitragvon an27 » Fr 9. Dez 2011, 15:48

Hallo Daniel,

vielen Dank für deine Antwort. Ich habe mich tatsächlich missverständlich ausgedrückt. Was ich meinte ist: um am Beispiel „Geschlecht“ zu bleiben: ich erwarte Unterschiede zwischen Mann und Frau, hab aber zu viele Männer, so dass ich 1600 Männer mit 400 Frauen vergleiche. Wenn ich nun Geschlecht als Moderator in einer Regressionsanalyse betrachte, ergeben sich keine Signifikanzen (alles schon getestet).
Nun kann ich (so meine Hoffnung) aber aufgrund meiner ungleichen Stichprobenverteilung Unterschiede nicht vollkommen ausschließen, oder? Machen nicht die vielen Männer meine möglichen Geschlechtseffekte nicht kaputt? Und wenn ja, gibt es vielleicht eine Art Gewichtung? Oder eine bessere Art der Berechnung?

Hoffe, ich konnte mich dieses Mal besser ausdrücken?

Auf jeden Fall schon mal ein großes Dankeschön für die Reaktion!
an27
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 9. Dez 2011, 12:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Moderator/Regression bei ungleicher Verteilung

Beitragvon daniel » Fr 9. Dez 2011, 22:40

Nun kann ich (so meine Hoffnung) aber aufgrund meiner ungleichen Stichprobenverteilung Unterschiede nicht vollkommen ausschließen, oder?

Unabhängig von der Stichprobe, der Verteilung oder was Dir sonst alles in den Sinn kommt, kannst Du niemals aus dem nicht Ablehnen der H0 sicher sein, dass H0 tatsächlich zutrifft. So funktioniert es nicht. (Das gilt im Übrigen auch für alle Statisitschen Tests, in denen wir die Null nicht verwerfen wollen, z.b. Tests auf Normalverteilung.)
Wenn man ehrlich ist, kannst Du sogar fast sicher davon ausgehen, dass H0 nicht zutrifft, unabhängig vom Ergebnis Deines Tests, weil die Hypothese eines Effektes der de facto 0.00 ist (standard in jeder Statistik Software) einfach nur völlig hirnlos ist. Aber über Sinn und Unsinn von Nullhypothesen Tests, und darum was diese Tests eigentlich Aussagen geht es hier ja nicht.

Machen nicht die vielen Männer meine möglichen Geschlechtseffekte nicht kaputt?

Ich halte das eher für unwahrscheinlich, aber würde nicht meine Hand dafür ins Feuer legen. Schätz doch Dein Modell mal nach Geschlechtern getrennt und schau Dir mal "per Augenmaß" die Koeffizienten an.

Wenn ich nun Geschlecht als Moderator in einer Regressionsanalyse betrachte, ergeben sich keine Signifikanzen (alles schon getestet).

Kannst Du Dein Modell mal skizzieren, eventuell auch mit etwas realem Inhalt? Vielleicht kannst Du auch noch was zur Theorie sagen. Muss/sollte kein Aufsatz sein, aber manchmal fangen die Probleme dort an, wo sie Ausenstehende nicht sehen, weil alles nur mit abstrakten, vereinfachten Beispeilen dargestellt wird und dazu jegliche inhaltliche Information fehlt.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Moderator/Regression bei ungleicher Verteilung

Beitragvon an27 » Mo 12. Dez 2011, 15:28

Vielen Dank!

Konkreter: ich schau mir z.B. unter anderem an, ob Mitarbeiter, die Angebote des Unternehmens, wie Kinderbetreuung, nutzen, generell weniger erschöpft,mehr commitet sind etc.

UV = Arbeitspensum, -belastung etc.
AV = Erschöpfung, Commitment etc.
Moderator = Kinderbetreuung etc.

Leider keine Effekte, jedoch nutzen unter meinen 4000 befragten Mitarbeitern nur z.B. 400 die Kinderbetreuung. D.h. so meine Überlegung: bin ich rechnerisch mit der Regressionsanalyse überhaupt in der Lage, Effekte zu finden, wenn die Stichprobenverteilung so aussieht?

Vielleicht mache ich aber auch nur einen Denkfehler – auf jeden Fall schon mal vielen Dank!
an27
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Fr 9. Dez 2011, 12:58
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Moderator/Regression bei ungleicher Verteilung

Beitragvon daniel » Mo 12. Dez 2011, 16:37

Edit:
Das Wichtigste zuerst. Nach dreimaligem lesen Deines Beitrags, fällt mir auf, dass

[...] ich schau mir z.B. unter anderem an, ob Mitarbeiter, die Angebote des Unternehmens, wie Kinderbetreuung, nutzen, generell weniger erschöpft,mehr commitet sind etc.


keinerlei Hinweis auf eine Moderation/Interaktion enthält. Bist Du sicher, dass Du hier etwas anders als ein additives Modell unterstellst?

Das ein höheres Arbeitspensum die Erschöpfung steigert klingt plausibel. Der Einfachheit halber kann man das auch mal als linearen Effekt modellieren (darüber muss man aber gegebenenfalls nachdenken). Die Idee, dass die Nutzung der Kinderbetreuung die Erschöpfung veringert klingt ebenfalls plausibel. Soweit steht das additive Modell

Erschöpfung = Arbeitspensum + Kinderbetreuung

Weniger zwingend finde ich es aber, dass der Zusammenhang zwischen Arbeitspensum und Erschöpfung von der Kinderbetreuung abhängt, dass also die Nutzung der Kinderbetreuung den Effekt des Arbeitspensums moderiert. Wieso sollte das so sein? Die Frage soll nicht implizieren, dass es hier keine multiplikative Verknüpfung gibt, aber ich würde gerne mal die Theorie dahinter hören, die eine solche prognostiziert. Wieso sollten Menschen, die ihr Kinde betreuen lassen, vom gleichen Arbeitspensum weniger erschöpft sein? Solange Du hier keine sehr plausibele Theorie hast, die bestenfalls schon mal irgendwo bestätigt wurde, würde ich eher am theoretischen Modell zweifeln, als bei der Stichprobenverteilung anzufangen.

Zum statistischen würde ich gerne noch ein Beispiel für die Koeffizienten (und Standardfehler) haben. Wie sehen, die denn in Deinem Modell aus?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 9 Gäste