Lineare Regression mit Dummys

Alle Verfahren der Regressionanalyse.

Lineare Regression mit Dummys

Beitragvon jochen87 » Fr 25. Nov 2011, 23:55

Hallo allerseits,

Ich habe zurzeit folgendes Problem mit meiner linearen Regression mit Dummy-Variablen:

Ich muss eine Regression der Form Y = a*(1+2*d1) + y2*d2 + y3*d3 + ... usw.
durchführen, wobei d1, d2, d3 etc. die Dummy-Variablen sind (entweder 0 oder 1),y2, y3 etc. die unabhängigen Variablen (also die Koeffizienten) und a die Konstante ist.

Die Frage bezieht sich dabei auf den Ausdruck a*(1+2*d1) bzw. wie ich diesen in den gängigen Statistik-Programmen überhaupt einbringen kann. Ich habe mich damit auch tagelang beschäftigt und komme leider auf keine Lösung.

Es gibt z.B. in Stata bei der linearen Regression den Befehl hascons ("user supplied constant"), doch ich werd aus diesem Befehl einfach nicht schlau.

Worum es bei der regression geht: Y sind z.b. Tages/Monatsrenditen, die Dummys stehen jeweils für die Tage bzw. Monate und y2,y3 sind entsprechend die Differenzen von z.B. januar und februarrendite. (Untersuchung des Januareffekts).

Ich hoffe ich konnte mein Problem relativ gut schildern und evtl. hätte jemand eine Lösung parat^^
jochen87
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 25. Nov 2011, 23:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression mit Dummys

Beitragvon daniel » Sa 26. Nov 2011, 13:48

Hier sind einige Dinge unklar.

[...]y2, y3 etc. die unabhängigen Variablen (also die Koeffizienten)
[...]
y2,y3 sind entsprechend die Differenzen von z.B. januar und februarrendite.


Was nun? Variablen, Differnezen oder Koeffizienten? Variablen != Koeffizienten.

Es gibt z.B. in Stata bei der linearen Regression den Befehl hascons


-hasconst- ist kein Befehl sodern eine Option. Ob das das richtige für Dich ist, ist mir unklar.

Ich versteh auch das Modell nicht. Insbesondere den zentralen Ausdruck (a*(1+2*d1). Wo kommt das Modell her? Was steht inhaltllichb hinter der multilpikativen Verknüpfung der Konstanten mit Dummy -- oder besser mit dem Wert 1 oder 3.
Mir scheint das Ganze eher eine Art AR Modell zu sein, also im Kontext der Zeitreihenanalyse angesiedelt. Dafür gibt es z.B. in Stata ganze Pakete. Vielleicht schaust Du mal im Manual unter [TS].
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Lineare Regression mit Dummys

Beitragvon jochen87 » Sa 26. Nov 2011, 16:11

daniel hat geschrieben:Hier sind einige Dinge unklar.

[...]y2, y3 etc. die unabhängigen Variablen (also die Koeffizienten)
[...]
y2,y3 sind entsprechend die Differenzen von z.B. januar und februarrendite.


Was nun? Variablen, Differnezen oder Koeffizienten? Variablen != Koeffizienten.


Ja es sind die Koeffizienten, die bei der Regression herauskommen. Die Werte an sich sind Differenzen, also der Wert y1 ist z.B. die Differenz zwischen Januar und Februarrendite (oder Montags und Dienstagsrendite), wobei die Januarrendite(Montagrendite) der Schnittpunkt a (alpha ist).

Um nochmal auf den Ausdruck a*(1+2*d1) zu kommen. Es soll schlichtweg gezeigt werden, dass die Montagsrendite 3 mal so groß ist wie die anderen Tagesrenditen (auch Weekend-Effekt genannt). Vielleicht ist der Ausdruck so genau nicht nötig, er wird jedoch in der (rennomierten) Studie benutzt. Das alpha ist dabei 1/3 der Montagsrendite, d1 der Dummy.
jochen87
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 25. Nov 2011, 23:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression mit Dummys

Beitragvon daniel » Sa 26. Nov 2011, 17:31

Vorab, ich kann Dir vermutlich nicht viel weiterhelfen, stelle aber dennoch ein paar Fragen, die für potentielle Helfer hoffentlich relevant sind.

Ja es sind die Koeffizienten, die bei der Regression herauskommen. Die Werte an sich sind Differenzen, [...]

Sorry, aber ich verstehe das noch immer nicht. Differenzen sind i.d.R. aus den Daten berechnet Regressionskoeffizienten sind geschätzt. Meinst Du mit "Differenzen" bereits die inhaltliche Interpretation der Koeffizienten?

Es soll schlichtweg gezeigt werden, dass die Montagsrendite 3 mal so groß ist wie die anderen Tagesrenditen (auch Weekend-Effekt genannt).

Wieso wird dann nicht einfach der Koeffizinet für Montagsrenditen geschätzt und danach mit den Koeffizienten für die anderen Tage verglichen, anstatt diesen, mir noch immer unverständlichen multiplikativen Term mit der Koinstanten einzuführen?

[...] in der (rennomierten) Studie benutzt.


Die "Quellenangabe" ist leider völlig nutzlos. Welcher potentielle Helfer soll denn mit dieser Angabe den relevanten Artikel finden, um sich davon selbst ein Bild zu machen? Ich zumindest verstehe aus Deinen Angaben leider nicht vollständig, wieso und wie der/die Autor/en sein/ihr Modell spezifiziert hat/haben?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
Inventar
Inventar
 
Beiträge: 739
Registriert: Mo 6. Jun 2011, 13:23
Danke gegeben: 0
Danke bekommen: 169 mal in 161 Posts

Re: Lineare Regression mit Dummys

Beitragvon jochen87 » Sa 26. Nov 2011, 17:56

daniel hat geschrieben:Vorab, ich kann Dir vermutlich nicht viel weiterhelfen, stelle aber dennoch ein paar Fragen, die für potentielle Helfer hoffentlich relevant sind.

Ja es sind die Koeffizienten, die bei der Regression herauskommen. Die Werte an sich sind Differenzen, [...]

Sorry, aber ich verstehe das noch immer nicht. Differenzen sind i.d.R. aus den Daten berechnet Regressionskoeffizienten sind geschätzt. Meinst Du mit "Differenzen" bereits die inhaltliche Interpretation der Koeffizienten?

Es soll schlichtweg gezeigt werden, dass die Montagsrendite 3 mal so groß ist wie die anderen Tagesrenditen (auch Weekend-Effekt genannt).

Wieso wird dann nicht einfach der Koeffizinet für Montagsrenditen geschätzt und danach mit den Koeffizienten für die anderen Tage verglichen, anstatt diesen, mir noch immer unverständlichen multiplikativen Term mit der Koinstanten einzuführen?

[...] in der (rennomierten) Studie benutzt.


Die "Quellenangabe" ist leider völlig nutzlos. Welcher potentielle Helfer soll denn mit dieser Angabe den relevanten Artikel finden, um sich davon selbst ein Bild zu machen? Ich zumindest verstehe aus Deinen Angaben leider nicht vollständig, wieso und wie der/die Autor/en sein/ihr Modell spezifiziert hat/haben?


1. Ja es ist bereits die inhaltliche Interpretation. Das hab ich 2x erwähnt...

2. Das alpha für Montagsrenditen (bzw. Schnittpunkt) ist nicht geschätzt. Es ist die tatsächliche durchschnittliche Rendite aller Montage. Die anderen Koeffizienten y1,y2,y3 etc. sind aber keine durchschnittliche Renditen, sondern Differenzen der durchschnittlichen Renditen (Montag-Dienstag, Montag-Mittwoch usw...). Das wäre wie ein Vergleich mit Äpfel und Birnen.

3. Es ging mir halt einfach darum, wie man bzw. auf welche Art einen Vorfaktor vor die Konstante setzen könnte. Ich könnte jetzt die ganze Studie anfangen zusammenzufassen aber das wäre wohl nicht der Zweck hier oder? Meine Angabe zur rennomierten Studie sollte einfach nur klarstellen, dass es sich nicht um quatsch handelt. Die Studie ist auch leider von 1980, ich müsste sie also einscannen...
jochen87
Grünschnabel
Grünschnabel
 
Beiträge: 5
Registriert: Fr 25. Nov 2011, 23:38
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 16 Gäste

cron