STATISTIK-FORUM.de

East Weeld · von **East Weeld** » Di 17. Jul 2018, 21:34

Hallo,

ich habe eine Frage bezüglich des Datenanalyseprogrammes "Stata". Mit Hilfe von Stata muss ich für die Uni eine multiplen Regressionsanalyse durchführen. Einen Datensatz musste ich hierzu auch erheben. Das Thema der multiplen Regressionsanalyse ist der Zusammenhang zwischen Gebrauchtwagenpreisen und Merkmalen der jeweiligen Gebrauchtwagen (wie Leistung, Kilometerstand, Anzahl Türen, Modell, so wie einige andere).

Mein Problem bezieht sich auf die nominal skalierten Merkmale hierbei. Ich habe diese Zwecks Durchführung der Regressionsanalyse bereits in Dummy-Variablen umgewandelt. Mit dem Befehl "regress" habe ich außerdem bereits die Analyse durchgeführt und die Regressionskoeffizienten erhalten.

Nun ist es aber so, dass man bei der Nutzung von Dummy-Variablen ja nicht alle Dummy-Variablen, die dasselbe Merkmal beschreiben (in meinem Fall z.B. Lackierung), in die Regressionsgleichung mit aufnehmen darf. Da man nur n-1 Dummy-Variablen aufnehmen darf, weil die Informationen, ansonsten redundant wären, erhält man dadurch auch nur n-1 Regressionskoeffizienten. Mein Problem ist nun, dass ich nicht genau verstehe, wie ich an die fehlenden Regressionskoeffizienten komme. Soweit ich es verstanden habe beschreibt "_cons" den y-Achsenabschnitt. Das müsste ja bedeuten, dass in diesem Punkt alle x-Werte "0" annehmen. Folglich, wenn alle Dummy-Variablen "0" annehmen, müsste daher doch genau in diesem Punkt auch gelten, dass alle "weggelassenen" Dummy-Variablen 1 annehmen. Diese Vermutung stütze ich auf der Tatsache, dass ein Auto ja nicht keine Farbe haben kann, und eine Dummy-Variable mit "0" nur für "hat diese Farbe nicht (nein)" und mit "1" für "ist so gefärbt (ja)" steht.

Daher meine Frage: Weiß jemand, wie ich aus dem Stata-Wert "_cons" die fehlenden Regressionskoeffizienten der "fehlenden" Dummy-Variablen errechnen kann? Kann ich diese überhaupt bestimmen, oder zählen sie quasi, weil sie ja den y-Achsenabschnitt darstellen, als "Ausgangswert" und wären somit "0"?

PonderStibbons · von **PonderStibbons** » Mi 18. Jul 2018, 09:18

Du suchst einen Regressionskoeffizienten für den Vergleich der gewählten Referenzkategorie mit sich selbst. Das ergibt keinen Sinn.

Mit freundlichen Grüßen

PonderStibbons

folgende User möchten sich bei PonderStibbons bedanken:
East Weeld

strukturmarionette · von **strukturmarionette** » Mi 18. Jul 2018, 09:18

Hi,

http://www.stata-forum.de/

Gruß
S.

East Weeld · von **East Weeld** » Mi 18. Jul 2018, 16:15

PonderStibbons hat geschrieben:Du suchst einen Regressionskoeffizienten für den Vergleich der gewählten Referenzkategorie mit sich selbst. Das ergibt keinen Sinn.

Mit freundlichen Grüßen

PonderStibbons

Dankeschön, ich arbeite das erste Mal mit Stata und finde mich deswegen leider noch nicht so gut zurecht.
Das heißt, das funktioniert dann überhaupt nicht? Reicht es dann, nur die anderen Koeffizienten anzugeben?

LG

bele · von **bele** » Fr 3. Aug 2018, 12:28

Hallo East Weeld,

wenn ich das hier richtig verstehe:

East Weeld hat geschrieben:... oder zählen sie quasi, weil sie ja den y-Achsenabschnitt darstellen, als "Ausgangswert" und wären somit "0"?

dann ist das die richtige Antwort. Du brauchst keine Dummyvariable für die Basiskategorie, alternativ kannst Du sie mit einem Koeffizienten von Null versehen, was auf das gleiche hinaus läuft.

Beantwortet das die Frage?

Ansonsten kannst Du ja mal eine Regression ohne Konstante ("nocons") versuchen. Ggf. gefällt Dir das Ergebnis besser.

LG,
Bernhard

STATISTIK-FORUM.de

Regressionskoeffizienten von weggelassenen Dummy-Variablen

Regressionskoeffizienten von weggelassenen Dummy-Variablen

Re: Regressionskoeffizienten von weggelassenen Dummy-Variabl

Re: Regressionskoeffizienten von weggelassenen Dummy-Variabl

Re: Regressionskoeffizienten von weggelassenen Dummy-Variabl

Re: Regressionskoeffizienten von weggelassenen Dummy-Variabl

Wer ist online?