multiple Regression, Dummy-Variablen als UV

Alle Verfahren der Regressionanalyse.

multiple Regression, Dummy-Variablen als UV

Beitragvon hquadrat » Mo 7. Mär 2016, 15:09

Hallo,

ich berechne eine Regression von Bildungsgrad, das ich in Kategorien erfasst habe und einem Wissenstest mit Punktwerten. Bildung habe ich zu sieben Dummy-Variablen umkodiert.

Wenn ich nun eine multiple Regression berechne, bekomme ich das Ergebnis ja für jede einzelne Dummy-Variable ausgegeben, ich kann also pro Variable eine Regressionsgleichung berichten.

Meine Frage:
Gibt es die Möglichkeit (oder wird das überhaupt gemacht?) eine Art "durchschnittlicher" Regressionsgleichung zu berichten, so dass ich beispielsweise sagen könnte
"Wenn der Bildungsgrad eine Klasse steigt, steigt der Punktwert im Wissenstest etwa um ..."

Es macht ja wenig Sinn, Regressionsgleichungen für jede der sieben Variablen zu berichten. Oder berichtet man in dem Fall einfach nur die insgesamt aufgeklärte Varianz?
hquadrat
Power-User
Power-User
 
Beiträge: 56
Registriert: Fr 23. Aug 2013, 04:42
Danke gegeben: 17
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon bele » Mo 7. Mär 2016, 15:35

hquadrat hat geschrieben:so dass ich beispielsweise sagen könnte "Wenn der Bildungsgrad eine Klasse steigt, steigt der Punktwert im Wissenstest etwa um ..."


Hallo hquadrat,

in diesem Fall würdest Du den Bildungsgrad metrisch statt ordinal betrachten. Das geht, wenn es bei Deinen Daten so ist, dass der Anstieg des Bildungsgrads um ein Grad auch tatsächlich der Wissenstest immer etwa gleich viel Zunahme zeigt. Das wirst Du freilich untersuchen und zeigen müssen.

Stell in Deiner Statistiksoftware den Bildungsgrad mal als metrisch ein und berechne die gewünschte Regression. Dann stell bitte eine Grafik von den Residuen ein (wahres Wissen auf der x-Achse und Residuen auf der y-Achse oder fitted-vs-residuals oder so was).

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon hquadrat » Mo 7. Mär 2016, 15:41

Hi Bernhard,

danke für Deine Antwort! "Bildungsgrad als metrisch" für die normale Variable, nicht die Dummys, richtig?
Und was hiervon

https://www.dropbox.com/s/0eapsnpdcxi4p ... t.PNG?dl=0

muss auf die Y-achse?

Hannes
hquadrat
Power-User
Power-User
 
Beiträge: 56
Registriert: Fr 23. Aug 2013, 04:42
Danke gegeben: 17
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon bele » Mo 7. Mär 2016, 16:21

Keine Ahnung. So lauter Großbuchstaben und merkwürdig abgekürzt. Sieht aus, als könnte das SPSS sein. Zu SPSS kann ich Dir nichts sagen. Wahrscheinlich irgendwas mit RESID am Ende

Wenn eine Gerade durch die Punktwolke aus metrisch betrachtetem Bildungsgrad und Punktzahl im Wissenstest passt, dann sollten die Residuen an allen Stellen von Bildungsgrad um Null schwanken (also ungefähr den Mittelwert Null haben). Das wäre dann schon ein deutlicher Hinweis darauf, dass so ein Satz wie "Wenn der Bildungsgrad eine Klasse steigt, steigt der Punktwert im Wissenstest etwa um ..." sinnhaft wäre.

Es findet sich bestimmt sonst jemand anderes der Dir einen einfachen Weg erklären kann um in SPSS zu checken, ob der lineare Zusammenhang gerechtfertigt angenommen werden kann oder nicht.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon bele » Mo 7. Mär 2016, 16:29

Sonst mach es einfacher. Lass die Regression weg und zeichne einfach nur den Bildungsgrad auf der x-Achse und die Wissenspunkte auf der y-Achse und schau, ob das leidlich auf einer Geraden liegt.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon hquadrat » Mo 7. Mär 2016, 17:12

Danke nochmals.

Macht das hier irgendwie Sinn?

https://www.dropbox.com/s/wi55xdiop3l93 ... 2.PNG?dl=0

Und das sind die Residuen:

https://www.dropbox.com/s/9nycslhh3c29r ... 3.PNG?dl=0

Sieht eher nicht so gut aus oder?
hquadrat
Power-User
Power-User
 
Beiträge: 56
Registriert: Fr 23. Aug 2013, 04:42
Danke gegeben: 17
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon bele » Mo 7. Mär 2016, 17:42

Hallo hquadrat,

hast Du wirklich nur einen Wert bei objektives Wissen = 2 und insgesamt nur 34 Werte oder werden da mehrere Kreise deckungsgleich übereinander gezeichnet, ohne dass man es sieht? Wenn ja, dann finde bitte einen Weg, Punktwolken zu plotten, ohne dass Übereinanderzeichnen zu falschen Eindrücken führt.

Residuen sind Vorhersagefehler. Aktuell scheint es, dass das lineare Modell immer negative Vorhersagefehler macht, wenn ein kleiner Wert vorherzusagen ist und immer positive Vorhersagefehler macht, wenn ein großer Wert vorherzusagen ist. Das würde für einen s-förmigen anstelle eines linearen Zusammenhangs sprechen.

Zeichne doch bitte noch eine Punktwolke: x-Achse mit Bildungsgrad, y-Achse mit Wissenspunkten und zwar so, dass man Überlappungen erkennen kann.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon hquadrat » Mo 7. Mär 2016, 18:03

Ich bekomme es nicht besser hin als so:

https://www.dropbox.com/s/0ctui6yp85hh8 ... 4.PNG?dl=0

Ich finde in SPSS nicht, wo man die Gruppierung von Daten deaktvieren kann. Wieso entscheidet SPSS sowas auch einfach für mich und gruppiert standardmäßig!?

In Excel sieht es genauso aus:

https://www.dropbox.com/s/r4it0irgly09c ... 6.PNG?dl=0
hquadrat
Power-User
Power-User
 
Beiträge: 56
Registriert: Fr 23. Aug 2013, 04:42
Danke gegeben: 17
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon bele » Mo 7. Mär 2016, 21:09

Ich weiß nicht wie es Dir geht, aber ich kann nicht erkennen, wieviele Werte hinter jedem dieser Punkte stehen. Unter diesem Vorbehalt könntest Du sagen, dass die Regressionsgerade für jeden Bildungsschritt 0,3 Wissenspunkte mehr vorhersagt, dass die Abweichungen von dieser Gerade aber erheblich sind, weil diese unter 7% der Varianz erklärt.
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5913
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts

Re: multiple Regression, Dummy-Variablen als UV

Beitragvon hquadrat » Mo 7. Mär 2016, 22:22

Ja, Du hast vollkommen recht, aber ich bekomme keine andere Gerade hin. Weißt Du gute Freeware, um das zu machen? Aber generell hast Du mir schon sehr geholfen: Nur, wenn der Zusammenhang linear ist, dann kann ich die Aussage "je, desto" treffen. Nochmal zum Anfang: Wie würdest Du verfahren, wenn dem nicht so ist und ich bei dem Vorgehen mit den Dummy-Variablen bleiben muss? Was würdest Du in einer Arbeit berichten? Macht es dann überhaupt Sinn, Regressionsgleichungen zu berichten? Ich würde intuitiv nur die aufgeklärte Varianz angeben.
hquadrat
Power-User
Power-User
 
Beiträge: 56
Registriert: Fr 23. Aug 2013, 04:42
Danke gegeben: 17
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste