OLS-Regressionen von Subgruppen

Alle Verfahren der Regressionanalyse.

OLS-Regressionen von Subgruppen

Beitragvon Richards » Mi 19. Jul 2017, 10:44

Hallo liebe Forenmitglieder,

ich habe eine Frage bezüglich der Analyse (OLS-Regressionen) von Subgruppen. Ich möchte unter Verwendung multivariater Regressionsanalysen (OLS) untersuchen, ob sich die Effekte der unabhängigen Variablen an unterschiedlichen Punkten der Verteilung der abhängigen Variablen unterscheiden.
Beispielsweise möchte ich untersuchen, ob sich die Effekte meiner unabhängigen Variablen auf das Haushaltseinkommen (AV) der Befragten, bei Befragten mit hohem Haushaltseinkommen unterscheiden von Befragten mit geringem Haushaltseinkommen. Hierfür bilde ich zwei Subsamples an der abhängigen Variablen (Haushaltseinkommen geringer als der Median (Gruppe 1) und Haushaltseinkommen höher als der Median Gruppe 2) und schätze jeweils für diese Subgruppen separate (aber identische) Regressionsmodelle. Werden durch dieses Vorgehen möglicherweise Prämissen der OLS-Regression verletzt?

Ich wäre sehr dankbar, wenn mir jemand weiterhelfen könnte. Literaturhinweise nehme ich natürlich auch sehr gerne entgegen.

Viele Grüße
Richard
Richards
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mi 19. Jul 2017, 09:48
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: OLS-Regressionen von Subgruppen

Beitragvon PonderStibbons » Mi 19. Jul 2017, 11:21

ich habe eine Frage bezüglich der Analyse (OLS-Regressionen) von Subgruppen. Ich möchte unter Verwendung multivariater Regressionsanalysen (OLS) untersuchen, ob sich die Effekte der unabhängigen Variablen an unterschiedlichen Punkten der Verteilung der abhängigen Variablen unterscheiden.

Multivariate Regression (mehrere abhängige Variablen) oder multiple Regression (mehrere Prädiktoren, 1 abhängige Variable)? Ich gehe im Weiteren mal von der zweiten Annahme aus.

Beispielsweise möchte ich untersuchen, ob sich die Effekte meiner unabhängigen Variablen

Das ist alles ziemlich abstrakt. Was für eine Studie ist das, mit was für eine Fragestellung, was sind das für unabhängige Variablen und wie groß ist die Stichprobe?
Hierfür bilde ich zwei Subsamples an der abhängigen Variablen (Haushaltseinkommen geringer als der Median (Gruppe 1) und Haushaltseinkommen höher als der Median Gruppe 2)

Mediansplits sind in aller Regel Murks. Warum hat jemand in der Mitte knapp unter dem Median ein "ganz anderes" Einkommen als sein Nachbar knapp über dem Median, aber "dasselbe" wie der Ärmste in der Stichprobe. Und eine Dichotomisierung am Median einer vorliegenden Stichprobe ist weder inhaltlich begründbar noch führt sie zu generalsierbaren Ergebnissen - der nächste Forscher hat eine andere Stichprobe mit einem abweichenden Median.

Du könntest weiter die Gesamtstichprobe verwenden und statt nur y = b0 + b1*x1 + b2*x2 + .... + e mit zusätzlichen Termen rechnen, je nach theoretischer Vorstellung z.B quadratische: y = b0 + b1*x1 + b2*x1² + .... + e oder auch logs etc.

Wie gesagt fehlen die meisten relevanten Angaben, daher weiß ich weder, warum und wozu Du es so analysieren möchtest, noch wie die Prädiktoren aussehen. Bei meistens (je nach betrachteter Population und Stichprobe) sehr schief verteilten Größen wie Einkommen kann auch eine Betrachtung des log(Einkommen) als abhängige Variable zielfrührend sein.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Richards

Re: OLS-Regressionen von Subgruppen

Beitragvon Richards » Mi 19. Jul 2017, 11:44

Lieber Ponderstibbons,

vielen Dank für Deine ausführliche Antwort. Es geht im Grunde darum zu untersuchen, ob sich die Effekte der unabhängigen Variablen (bspw. die Anzahl der Kinder im Haushalt) auf das Haushaltseinkommen (bzw. log(Einkommen)) in dem Sub-Sample der Befragten in Gruppe 1 (Haushaltseinkommen geringer als der Median) von den Effekten in dem Sub-Sample der Befragten in Gruppe 2 (Haushaltseinkommen höher als der Median) unterscheiden.
Wenn ich theoretisch annehmen sollte (das hier ist leider nur ein fiktives Beispiel), dass sich der Effekt der UV "Anzahl der Kinder im Haushalt" zwischen diesen beiden Gruppen unterscheidet, könnte man dies so untersuchen? Ich vermute ein Problem darin, dass das Haushaltseinkommen abhängige Variable und "Gruppierungsvariable" gleichzeitig ist.
Deine Hinweise z.B. zum log(Einkommen) werde ich berücksichtigen.

Brauchst Du weitere Angaben?

Viele Grüße
Richard
Richards
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Mi 19. Jul 2017, 09:48
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 15 Gäste