Vergleich Dummy Gruppen

Alle Verfahren der Regressionanalyse.

Vergleich Dummy Gruppen

Beitragvon klaus » Mo 18. Jun 2012, 12:07

Hallo alle Miteinander,

Ich habe folgendes Problem:

Ich möchte einen Zusammenhang statistisch untersuchen. Als ersten Schritt möchte ich den Zusammenhang zweier Variablen (abhängige Variable: Spendenbereitschaft, unabhängige Variable: Einkommen und noch ein paar andere, die hier nicht von Bedeutung sind) mit Hilfe einer Regression untersuchen. In einem zweiten Schritt würde ich das Einkommen mit Hilfe von Dummy Variablen in 6 Gruppen einteilen. Dafür habe ich 6 Dummy Variablen gebildet. Jetzt würde ich gerne diese sechs Gruppen vergleichen und optimalerweise herausfinden welche Gruppe das höchste Spendenaufkommen hat. Mir ist nicht ganz klar, ob und wenn ja, wie das möglich ist. Meine Idee ist, 6 verschiedene Regressionen durchzuführen und dabei jeweils immer eine Variable nicht zu setzen. Auf diese Weise kann ich, wenn ich es richtig verstehe, an den Dummys ablesen, inwieweit sich die Gruppen von der nicht gesetzten Gruppe (Referenzgruppe) unterscheiden. Mit Hilfe von Transitivität kann ich dann herausfinden, welche Gruppe am besten ist.

Stimmt das so? Oder bin ich da auf dem völlig falschen Weg? Kann ich eine solche Aussage überhaupt mit Hilfe der Regression treffen?

Ich hoffe irgendjemand kann mir helfen.....

Vielen Dank schon mal

Grüße

k.
klaus
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mo 18. Jun 2012, 11:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Vergleich Dummy Gruppen

Beitragvon PonderStibbons » Mo 18. Jun 2012, 12:13

Jetzt würde ich gerne diese sechs Gruppen vergleichen und optimalerweise herausfinden welche Gruppe das höchste Spendenaufkommen hat.

Spendenaufkommen scheint eine rational skalierte Variable zu sein
(Geldbetrag)? In dem Fall wäre an eine Varianzanalyse zu denken,
mit post-hoc Tests zum paarweisen Vergleich der Einkommensgruppen
oder einem "linearen Konrast", falls eine klare Hypothese vorliegt.
Zusätzliche Variablen kann man als Kovariaten in die Analyse aufnehmen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
klaus

Re: Vergleich Dummy Gruppen

Beitragvon klaus » Mo 18. Jun 2012, 13:28

Vielen Dank für die schnelle Antwort!

Spendenaufkommen ist rational skaliert. Ich denke einen linearen Kontrast könnte ich durchführen, was ich allerdings noch nie getan habe. Meine Idee: Ich habe ja bereits die Ergebnisse der Regression ohne Dummy Variablen und könnte somit meine Hypothesen daraus folgern und dann über einen linearen Kontrast herausfinden, ob meine Hypothese stimmt.
z.B. H0: Spendenaufkommen steigt linear mit Einkommen.
Kann ich über den Linearen Kontrast, dann feststellen ob h0 gilt, oder auch sagen, welche Gruppe das höchste Spendenaufkommen hat? und Wenn ja, wie?

Vielen Dank.

Beste Grüße

k.
klaus
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mo 18. Jun 2012, 11:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Vergleich Dummy Gruppen

Beitragvon PonderStibbons » Mo 18. Jun 2012, 14:17

Meine Idee: Ich habe ja bereits die Ergebnisse der Regression ohne Dummy Variablen und könnte somit meine Hypothesen daraus folgern und dann über einen linearen Kontrast herausfinden, ob meine Hypothese stimmt.

Ich habe mich wohl zu knapp ausgedrückt: falls a priori, also vor Inspektion
der Daten, klare und in einen linearen Kontrast übersetzbare Hypothesen vorlagen,
wäre an solche zu denken. Das entfällt also hier.
z.B. H0: Spendenaufkommen steigt linear mit Einkommen.

Wozu brauchst Du bei so einer Hypothese denn die Gruppierung? Da rechnest
Du eine Regression Spendenaufkommen = b1*Einkommen + b2*Einkommen²
(+ gegebenenfalls "Kontrollvariablen").

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
klaus

Re: Vergleich Dummy Gruppen

Beitragvon klaus » Mo 18. Jun 2012, 14:27

Ich glaube ich blicke selbst nicht so ganz durch meine Aufgabe bzw. Idee durch:

Meine Aufgabe war, dass ich über eine lineare Regression herausfinde, ob das Spendenaufkommen mit dem Einkommen steigt. Mein Ergebnis ist, dass das Spendenaufkommen, statistisch signifikant positiv auf dem 5%-Niveau mit dem Einkommen ansteigt. Damit ist mein Ergebnis ja eigentlich: Je höher das Einkommen, desto höher die Spenden. Wenn ich mir jetzt den Graphen der Mittelwerte des Einkommens der Gruppen anschaue, dann sieht das nicht sehr linear ansteigend aus, sondern steigt am Anfang an und fällt dann (Gruppe 7,8) leicht ab. Jetzt möchte ich herausfinden, ob es ein Einkommen gibt, bei dem das Spendenaufkommen am größten ist. Daraufhin habe ich meinen Datensatz in Gruppen aufgeteilt, abhängig von der Höhe des Einkommens. Jetzt würde ich gern herausfinden, für welche Gruppe das Spendenaufkommen am höchsten ist.

Ich bin mir gar nicht sicher, ob nicht dieser zweite Schritt nur dann Sinn macht, wenn ich in der Regression keine signifikanten Ergebnisse herausfinden konnte. kann das sein?

Vielen Dank. Ich hoffe jemand kann meine Verwirrung lösen.
Die Unterstützung hier im Forum ist wirklich große Klasse!

Gruß
k.
klaus
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mo 18. Jun 2012, 11:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Vergleich Dummy Gruppen

Beitragvon PonderStibbons » Mo 18. Jun 2012, 14:38

Wenn ich mir jetzt den Graphen der Mittelwerte des Einkommens der Gruppen anschaue, dann sieht das nicht sehr linear ansteigend aus, sondern steigt am Anfang an und
fällt dann (Gruppe 7,8) leicht ab.

Ist damit gemeint, wenn das Einkommen in Grupen eingeteilt wird, dann liegt
das durchschnittliche Spendenaufkommen der beiden höchsten Gruppen
niedriger als bei den unmittelbar vorausgehenden? Solche [umgekehrt]
U-förmigen Beziehungen testet man wie gesagt durch die Aufnahme von
Einkommen² in eine Regression (Einkommen nicht gruppiert, sondern so wie
erhoben). Allerdings ist im vorliegenden Fall die Schwierigkeit, dass erst
getestet werden soll, nachdem der Augenschein etwas Auffälliges gezeigt hat.
Die p-Werte sind damit nur sehr fraglich zuverlässig. Wie groß ist die Stichprobe?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
klaus

Re: Vergleich Dummy Gruppen

Beitragvon klaus » Mo 18. Jun 2012, 14:50

der Datensatz hat 2100 Einträge, ist also relativ groß. Allerdings ist die Anzahl in den einzelnen Gruppen sehr unterschiedlich ( in der Randgruppe nur 20), ich weiß nicht ob das ein Problem sein kann. Für den Test auf umgekehrte U-Form müsste ich also eine quadratische Regression durchführen?
Wie sähe es aus, wenn ich in der linearen Regression keinen statistisch signifikanten Zusammenhang herausfinden würde? Wie könnte ich dann herausfinden, in welcher Gruppe das Spendenaufkommen am größten ist?

Vielen Dank.

Besten Gruß
k.
klaus
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mo 18. Jun 2012, 11:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Vergleich Dummy Gruppen

Beitragvon PonderStibbons » Mo 18. Jun 2012, 15:54

Meines Erachtens stellt sich die Frage nicht, welche willkürlich
gebildete Gruppe den höchsten Wert hat, wenn die lineare plus
quadratische Regression keine Effekte zeigt.

Aber wenn Du unbedingt diese Gruppenvergleiche rechnen
willst (wobei mich wundert, dass es erst 6 Gruppen waren,
zuletzt bereits deren 9), dann verzichte vielleicht von
vornherein auf eine Regression und rechne eine ANOVA mit
Tukey post-hoc Tests.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11363
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

Re: Vergleich Dummy Gruppen

Beitragvon klaus » Mo 18. Jun 2012, 16:18

Oh Entschuldigung, ich habe mich bei dem zweiten Post mit den Gruppen vertan. Habe verschiedene Gruppeneinteilungen gemacht und es ist nicht Gruppe 7 und 8 die abfällt, sondern 5 und 6.

Vielen dank. Ich denke, dass ich dann die Gruppenvergleiche weglassen werde und die zwei Regressionsarten durchrechne.

Vielen Dank für die schnelle Hilfe hier im Forum! Ich kann es nur empfehlen!

Beste Grüße

k.
klaus
Grünschnabel
Grünschnabel
 
Beiträge: 8
Registriert: Mo 18. Jun 2012, 11:55
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 7 Gäste