Interpretation von Dummy Variablen in multivariater Regress.

Alle Verfahren der Regressionanalyse.

Interpretation von Dummy Variablen in multivariater Regress.

Beitragvon slado » Mo 4. Sep 2017, 19:25

Hi Forum,

ich weiß das auf gute Fragen, gute Antworten folgen. Ich habe aber große Probleme meine Frage gut zu verpacken.

Ich untersuche in einem Unternehmen einen Datensatz bei dem es daraum geht Beziehungstrukturen aufzudecken. Also wie starke die UV's die AV "beeinflussen". Die Güte als Prognosemodell spielt dabei keine Rolle.

Ich habe 19 Dummy-Variablen mit mehr als 2 Ausprägungen und 3 metrische Variablen bein n>20.000

Wie interpretiere ich die Regressionkoeffizienten bei Dummy-Variablen? Sowohl auf das Vorzeichen bezogen als auch auf den Wert?
Kann ich die Dummy Variablen nur innerhalb ihrer Kategorie vergleichen?
BSP. Daten
D1=Material.Alu = +5,484
D2=Material.Eisen = -3,344
D3=Mitarbeiter.Schulz = +1,435
Menge = +2,030
AV = Kosten (metrisch)

Danke für Eure Hilfe.
slado
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 4. Sep 2017, 18:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Interpretation von Dummy Variablen in multivariater Regr

Beitragvon PonderStibbons » Mo 4. Sep 2017, 21:46

Ich habe 19 Dummy-Variablen mit mehr als 2 Ausprägungen und 3 metrische Variablen bein n>20.000

Dummy Variablen (0/1-Variablen) können per Definition nicht mehr als 2 Ausprägungen haben. Was ist konkret gemeint?
Wie interpretiere ich die Regressionkoeffizienten

Wie sieht das Modell insgesamt denn aus, was wird worauf regrediert? Nicht so recht klar, worum es geht und was konkret gemessen wurde.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
slado

Re: Interpretation von Dummy Variablen in multivariater Regr

Beitragvon slado » Di 5. Sep 2017, 09:52

Hi Poner,

danke für deine Antwort, ich versuche es noch einmal verständlicher :D

Dummy Variablen (0/1-Variablen) können per Definition nicht mehr als 2 Ausprägungen haben. Was ist konkret gemeint?


Ich habe nominal skalierte Variablen:
Material mit den Ausprägungen (Alu, Stahl, Eisen)
Mitarbeiter (Schulz, Meier, Holsten, Becks)
Produktgruppe( Gruppe1, Gruppe2, Gruppe3 ,Gruppe4)
usw.
Dann habe ich metrisch skalierte Variablen
Preis
Menge


Wie sieht das Modell insgesamt denn aus, was wird worauf regrediert? Nicht so recht klar, worum es geht und was konret gemesen wurde.


Ich möchte untersuchen, welche Variablen, welchen Einfluss auf meine AV (Terminliche Abweichung in Tagen) haben.

Die nominal skalierten Variablen habe ich via SPSS in Dummy Variablen codiert.
Nach dem Schema:
Material D1 D2 D3
Alu 1 0 0
Stahl 0 1 0
Eisen 0 0 1
usw.

Mein Datensatz sieht dann wie folgt aus:
Beobachtung1: Preis=5€ | Menge=200 |Dummy Mitarbeiter_Schulz = 1 |Dummy Mitarbeiter_Meier = 0 | Dummy Mitarbeiter_Becks = 0|Dummy Mitarbeiter_Holsten = 0 |Dummy Produktgruppe 1 = 1|Dummy Produktgruppe 2 = 0|Dummy Produkgruppe 3 = 0|Dummy Material_Eisen = 0 |Dummy Material_Stahl=1 |Dummy Material_Alu = 0 |Terminliche Abweichung = -3 |

Der Output von SPSS sieht dann wie folgt aus:

UV --- Koeff. --- std. Beta
Dummy Material Eisen --- -3,373 --- 0,212
Dummy Material Stahl --- + 2,110 --- 0,064
Dummy Material Alu --- +2,100 --- 0,004
Dummy Mitarbetier Schulz --- +0,022 --- usw.
Dummy Mitarbeiter Meier --- +1,223
Dummy Mitarbeiter Becks --- -9,399
Dummy Mitarbeiter Holsten --- +3,492
Dummy Produktgruppe 1 --- +3,000
Dummy Produktgruppe 2 --- -0,788
Dummy Produktgruppe 3 --- +2,838
Menge --- +0,034
Preis --- -0,937

Wie kann ich die Koeff. und die std. Betas jetzt interpretieren, bezogen auf meine AV "Terminliche Abweichung"
Ich habe gelesen, dass bei Dummy Variablen die Betas quasi für die Tonne sind und nicht vergleichbar sind.

Kann ich die Koeff. der Dummys wie metrischen Variablen interpretieren?
"Wenn die Menge um 1 steigt, steigt die Terminliche Abweichung um +0,34 ".

"Wenn in Produktgruppe 1 ein Teil mehr prodoziert wird, steigt die Terminliche Abweichung um +3

Beste Grüße

S.
slado
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 4. Sep 2017, 18:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Interpretation von Dummy Variablen in multivariater Regr

Beitragvon PonderStibbons » Di 5. Sep 2017, 11:11

Ich möchte untersuchen, welche Variablen, welchen Einfluss auf meine AV (Terminliche Abweichung in Tagen) haben.

Wenn die Prädiktoren nicht unabhängig voneinander sind, sondern miteinender korreliert sind (sozusagen mit ihren Erklärungsanteilen bei der abhängigen Variable überlappen), ist es kaum sauber auseinanderzuhalten.

Die nominal skalierten Variablen habe ich via SPSS in Dummy Variablen codiert.
Nach dem Schema:
Material D1 D2 D3
Alu 1 0 0
Stahl 0 1 0
Eisen 0 0 1
usw.

Eine Variable mit k Kategorien wird in k-1 dummy-Variablen umgewandelt. Eine der Kategorien erhält keinen eigenen Dummy (das wäre redundant) und fungiert als Referenzkategorie.

Wie kann ich die Koeff. und die std. Betas jetzt interpretieren, bezogen auf meine AV "Terminliche Abweichung"
Ich habe gelesen, dass bei Dummy Variablen die Betas quasi für die Tonne sind und nicht vergleichbar sind.

Ich muss gestehen, dass ich nicht verstehe, was dieser Satz aussagen soll.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts

folgende User möchten sich bei PonderStibbons bedanken:
slado

Re: Interpretation von Dummy Variablen in multivariater Regr

Beitragvon slado » Di 5. Sep 2017, 14:19

Eine Variable mit k Kategorien wird in k-1 dummy-Variablen umgewandelt. Eine der Kategorien erhält keinen eigenen Dummy (das wäre redundant) und fungiert als Referenzkategorie.


Ich habe das mit SPSS und der Option Tranformieren/Dummy Variablen gemacht.
Ich glaube das SPSS das so codiert.
D1 Material_Eisen (Ja=1/Nein=0)
D2 Material_Alu(Ja=1/Nein=)
Die Referenzkategorie ist somit immer nur der Fall das es nicht zutrifft!? Für jede Dummy Variable singuär gesehen. Eine 1. beudetet, Material _Alu wurde verwendet. Eine 0. bedeutet, es wurde kein Alu verwendet aber möglicherweise alles andere.

Das bedeutet ja dann, dass ich keine Vergleiche zwischen den Dummys anstellen kann sondern nur jeder Dummy für sich bewerten lässt.

Wie siehst du das?
slado
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Mo 4. Sep 2017, 18:46
Danke gegeben: 2
Danke bekommen: 0 mal in 0 Post

Re: Interpretation von Dummy Variablen in multivariater Regr

Beitragvon PonderStibbons » Di 5. Sep 2017, 18:50

Das Modell nur mit den Metallen wäre
y = b0 + b1*Eisen+b2*Alu+Fehler.

Sind Eisen und Alu jeweils = 0 hat man das Modell für das Referenz-Metall: y = b0 +b1*0+b2*0+Fehler = b0+Fehler.

Hat ein Fall "Eisen" (und sonst nichts), dann lautet das Modell
y = b0 + b1*1 + b2*0 + Fehler

Das heißt, im Vergleich zum Referenz-Metall ändert sich die Vorhersage von b0 auf b0+b1.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11362
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2501 mal in 2485 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste

cron