Regressionskoeffizienten von weggelassenen Dummy-Variablen

Alle Verfahren der Regressionanalyse.

Regressionskoeffizienten von weggelassenen Dummy-Variablen

Beitragvon East Weeld » Di 17. Jul 2018, 21:34

Hallo,

ich habe eine Frage bezüglich des Datenanalyseprogrammes "Stata". Mit Hilfe von Stata muss ich für die Uni eine multiplen Regressionsanalyse durchführen. Einen Datensatz musste ich hierzu auch erheben. Das Thema der multiplen Regressionsanalyse ist der Zusammenhang zwischen Gebrauchtwagenpreisen und Merkmalen der jeweiligen Gebrauchtwagen (wie Leistung, Kilometerstand, Anzahl Türen, Modell, so wie einige andere).

Mein Problem bezieht sich auf die nominal skalierten Merkmale hierbei. Ich habe diese Zwecks Durchführung der Regressionsanalyse bereits in Dummy-Variablen umgewandelt. Mit dem Befehl "regress" habe ich außerdem bereits die Analyse durchgeführt und die Regressionskoeffizienten erhalten.

Nun ist es aber so, dass man bei der Nutzung von Dummy-Variablen ja nicht alle Dummy-Variablen, die dasselbe Merkmal beschreiben (in meinem Fall z.B. Lackierung), in die Regressionsgleichung mit aufnehmen darf. Da man nur n-1 Dummy-Variablen aufnehmen darf, weil die Informationen, ansonsten redundant wären, erhält man dadurch auch nur n-1 Regressionskoeffizienten. Mein Problem ist nun, dass ich nicht genau verstehe, wie ich an die fehlenden Regressionskoeffizienten komme. Soweit ich es verstanden habe beschreibt "_cons" den y-Achsenabschnitt. Das müsste ja bedeuten, dass in diesem Punkt alle x-Werte "0" annehmen. Folglich, wenn alle Dummy-Variablen "0" annehmen, müsste daher doch genau in diesem Punkt auch gelten, dass alle "weggelassenen" Dummy-Variablen 1 annehmen. Diese Vermutung stütze ich auf der Tatsache, dass ein Auto ja nicht keine Farbe haben kann, und eine Dummy-Variable mit "0" nur für "hat diese Farbe nicht (nein)" und mit "1" für "ist so gefärbt (ja)" steht.

Daher meine Frage: Weiß jemand, wie ich aus dem Stata-Wert "_cons" die fehlenden Regressionskoeffizienten der "fehlenden" Dummy-Variablen errechnen kann? Kann ich diese überhaupt bestimmen, oder zählen sie quasi, weil sie ja den y-Achsenabschnitt darstellen, als "Ausgangswert" und wären somit "0"?
East Weeld
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 17. Jul 2018, 21:28
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regressionskoeffizienten von weggelassenen Dummy-Variabl

Beitragvon PonderStibbons » Mi 18. Jul 2018, 09:18

Du suchst einen Regressionskoeffizienten für den Vergleich der gewählten Referenzkategorie mit sich selbst. Das ergibt keinen Sinn.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11364
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
East Weeld

Re: Regressionskoeffizienten von weggelassenen Dummy-Variabl

Beitragvon strukturmarionette » Mi 18. Jul 2018, 09:18

Hi,

http://www.stata-forum.de/


Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Regressionskoeffizienten von weggelassenen Dummy-Variabl

Beitragvon East Weeld » Mi 18. Jul 2018, 16:15

PonderStibbons hat geschrieben:Du suchst einen Regressionskoeffizienten für den Vergleich der gewählten Referenzkategorie mit sich selbst. Das ergibt keinen Sinn.

Mit freundlichen Grüßen

PonderStibbons


Dankeschön, ich arbeite das erste Mal mit Stata und finde mich deswegen leider noch nicht so gut zurecht.
Das heißt, das funktioniert dann überhaupt nicht? Reicht es dann, nur die anderen Koeffizienten anzugeben?

LG
East Weeld
Grünschnabel
Grünschnabel
 
Beiträge: 2
Registriert: Di 17. Jul 2018, 21:28
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Regressionskoeffizienten von weggelassenen Dummy-Variabl

Beitragvon bele » Fr 3. Aug 2018, 12:28

Hallo East Weeld,

wenn ich das hier richtig verstehe:
East Weeld hat geschrieben:... oder zählen sie quasi, weil sie ja den y-Achsenabschnitt darstellen, als "Ausgangswert" und wären somit "0"?


dann ist das die richtige Antwort. Du brauchst keine Dummyvariable für die Basiskategorie, alternativ kannst Du sie mit einem Koeffizienten von Null versehen, was auf das gleiche hinaus läuft.

Beantwortet das die Frage?

Ansonsten kannst Du ja mal eine Regression ohne Konstante ("nocons") versuchen. Ggf. gefällt Dir das Ergebnis besser.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5912
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1397 mal in 1383 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste

cron