multiple Regression mit mehreren Dummy-Variablen

Alle Verfahren der Regressionanalyse.

Re: multiple Regression mit mehreren Dummy-Variablen

Beitragvon timostatistik » Di 5. Nov 2019, 18:47

Hallo zusammen,

mir erschließt sich die Fragestellung von Apfelsine sehr wohl - wahrscheinlich, weil auch ich keine tiefgreifendere Statistik-Ausbildung genossen habe ;)

Ich probiere mein Problem (wie gesagt vermutlich das gleiche wie bei Apfelsine) verständlich zu formulieren und hoffe, dass Du, Strukturmarionette, oder ein/e andere/r Wissende/r hilfsbereit ist und mir/uns helfen kann/st:

Neben dem Einfluss meiner kategorialer UV (4 verschiedene Treatmentgruppen) möchte ich den Einfluss verschiedener kategorialen Kontrollvariablen (unter anderem Geschlecht, Höchster Bildungsabschluss, Beruf, Einkommen, usw..) auf eine intervallsaklierte AV untersuchen (bzw. einen signifikanten Einfluss der Kontrollvariablen auf die AV ausschließen).

Ich vermute, dass ein multiples lineares Regressionsmodell mit N=91 und intervallskalierter AV dabei helfen kann - liege ich hier richtig?

Da meine UV und die Kontrollvariablen kategorial/nominalskaliert sind, habe ich die UV und jede KV jeweils in mehrere Dummy-codierte Variablen mit 0/1 überführt (die genaue statistische Bezeichnung ist auch mir nicht bekannt - ich freue mich über Verbesserungen, denke aber, dass es verständlich ist, was Apfelsine und ich meinen). Meine Frage gleicht nun der von Apfelsine zu Beginn des Threads:

Ich habe es bisher so verstanden, dass, wenn ich beispielsweise lediglich den Einfluss der drei Dummy-codierten Variablen der AV auf die UV per multipler linearer Regression rechne, die Werte der Regressionskoeffizienten den Unterschied der entsprechenden Treatmentgruppe im Vergleich zur Referenzkategorie (in meinem Fall der Kontrollgruppe) aufzeigen. Nun stellt sich auch mir die Frage, ob ich nun für jede KV eine eigene multiple lineare Regression durchführen muss, oder ich ich die UV und alle KVs gemeinsamem in einer multiplen linearen Regression rechnen kann. Falls letzteres der Fall ist: Wie wäre eine signifikanter Einfluss (beispielsweise der Dummy-codierten Variable "männlich") zu interpretieren? Gibt der Regressionskoeffizient der Variable "männlich" nun weiterhin den Unterschied zur Referenzkategorie (Beispielsweise der dummy-codierten Variable "weiblich") an? Oder ist dies nicht mehr der Fall, da die Konstante des Modells sich nun nicht mehr nur auf das Geschlecht, sondern auch auf alle anderen KVs und die UV bezieht?

Ich hoffe, die Angaben waren verständlich - für Rückfragen stehe ich natürlich gerne zur Verfügung.

Besten Dank bereits vorab und
MfG
t.
timostatistik
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 5. Nov 2019, 18:28
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: multiple Regression mit mehreren Dummy-Variablen

Beitragvon bele » Mi 6. Nov 2019, 18:25

Hallo,

also ich greife nochmal das Beispiel mit Geschlecht und Jahreszeiten auf. Nehmen wir an, Sommer und Frau sind die Referenzkategorien, für die Ihr keine Dummyvariable habt. Dann beschreibt der Basisfall (die Konstante im Modell) eine Frau im Sommer. Wenn der Koeffizent für "Mann-Sein" signifikant wird, dann hat man für einen Mann einen anderen Wert anzunehmen als für eine Frau und wenn der Koeffizient für Winter signifikant wird, dann hat man für den Winter einen anderen Wert anzunehmen als für den Sommer. Das ist beides in einer linearen Regression zu erschlagen.
Indem Ihr Euch für ein einfaches lineares Modell entschieden habt habt Ihr auch gesetzt, dass der Effekt von Mann-Sein und von Winter durch einfache Addition zu beschreiben ist und innerhalb dieses Modells beschreibt die eine Signifikanz, dass der Summand für Mann signifikant und der Summand für Winter signifikant ist.

Wenn jetzt z.B. die Dummyvariable "Winter" einen signifikantes negatives Regressionsgewicht hat, bedeutet dies dann trotzdem, dass das Kriterium im Winter niedriger ausgeprägt ist als im Sommer?


Ja

Also wird für jede einbezogene Dummy-Variable nur der Unterschied zur jeweiligen Referenzgruppe getestet?


Die Referenzgruppe ist dann der Rest des Modells, also die Frau im Sommer wenn sich um Falle einer Abweichung von "Frau" schon ein anderer Koeffizient um den Geschlechterunterschied kümmert. Es wird also immer im Zusammenwirken aller Koeffizienten getestet, ob dieser Koeffizient hinreichend sicher nicht Null ist.

HTH,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5908
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1396 mal in 1382 Posts

Re: multiple Regression mit mehreren Dummy-Variablen

Beitragvon timostatistik » Mo 11. Nov 2019, 15:08

Vielen Dank für die Erklärungen, @Bele.

strukturmarionette hat geschrieben:- Derartige Variablen ('Dummys') existieren nicht bzw es maximieren derartige Begriffe die Unverständlichkeit und allgemeine Irritation.


...diese Aussage hat offenkundig nicht nur nicht weitergeholfen, sondern scheint auch noch falsch zu sein. Ein wenig mehr Toleranz gegenüber Statistik-Neulingen wäre in diesem Forum meiner Meinung nach durchaus angebracht.

MfG
timostatistik
timostatistik
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 5. Nov 2019, 18:28
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Vorherige

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 11 Gäste

cron