Multiple Lineare Regression-Regressoren

Alle Verfahren der Regressionanalyse.

Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Mi 2. Dez 2015, 15:17

Hallo Leute,
ich schreibe derzeit meine Masterarbeit und merke, dass meine Forschungsfrage recht wenig Sinn ergibt und ich darüber hinaus mein statistisches Können überschätzt habe, weshalb ich jetzt irgendwie das schlimmste verhindern muss.
Aber von vorne: Thema meiner Arbeit sind Dark Pools (anonyme Handelsplattformen für Wertpapiere). Diese Handelsplattformen werden (angeblich) von Hochfrequenzhändlern heimgesucht. Ich möchte in meiner Arbeit den Einfluss gewisser technischer Eigenschaften der einzelnen Pools auf ihre "Beliebtheit" bei Hochfrequenzhändlern untersuchen, mittels multipler linearer regression. Ich habe 30+ verschiedene Dark Pools, die sich teilweise in ihren technischen Modalitäten sehr unterscheiden, beispielsweise in welcher Reihenfolge Bestellungen im Orderbook aufgenommen werden oder welche Algorithmen erlaubt sind. Diese Eigenschaften sollen meine unabhängigen Variablen werden. Meine abhängige Variable hingegen ergibt sich aus den Handelsvolumen, welche die amerikanische Finanzbehörde wöchentlich veröffentlicht. Jetzt meine erste Frage: Macht das so weit Sinn (mein Professor hat zwar mein Expose akzeptiert, ist seitdem aber leider abgetaucht, deshalb kann ich ihn nicht fragen)?

Wenn ja, ergeben sich für mich weitere Fragen (die in euren Augen möglicherweise ziemlich dumm sind, aber ich hab ewig keine Statistik mehr gemacht :oops: ):
Inwieweit muss ich Regressoren als auch Regressant quantifizieren? Reicht es, pro Regressor einfach beispielsweise 3 mögliche Ausprägungen zu erlauben? Als Beispiel time-in-force instructions (gibt an, wie lange eine order im orderbook bleibt, bis sie wieder gelöscht wird): Kann ich da einfach sagen, die time-in-force Variable kann die Werte annehmen:
1: nur (immediate-or-cancel)
2: (Immediate-or-cancel) + Resting order
3: (Immediate-or-cancel) + Resting order + (Fill-or-kill)

Oder ist das völliger Stuss und ich muss das wesentlich genauer quantifizieren?
Dieselbe Frage stellt sich für mich letztlich auch für den Regressanten. Aus den Finanzbehörden Daten kann ich Dinge wie daily average volume order average trade size ableiten, aus denen man wiederum auf die Aktivität von Hochfrequenzhändlern schließen kann. Kann ich da auch einfach die einzelnen Werte kombinieren und dann eine jeweilige Ausprägung bestimmen? Zum Beispiel: Bei average trade size ist der Pool im 4. Qantil und Overall Trade size im 2. Quantil, ergo steck ich ihn in Gruppe 3!? (dass average trade size und overall trade size korreliert sind, vergessen wir jetzt einfach mal)

Ihr merkt, dass mein statistisches Wissen arg begrenzt ist, es geht mir auch schon gar nicht mehr darum, einen großartigen Beitrag zur Finanzwissenschaft abzuliefern, der Zug ist leider abgefahren. Ich muss diese Arbeit nur irgendwie halbwegs glimpflich über die Bühne bringen (bin an einer Business School und das ist hier ohnehin kein akademisches Hochreck).
Ich bin für jede Hilfe extrem dankbar!
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression-Regressoren

Beitragvon PonderStibbons » Mi 2. Dez 2015, 18:27

Mit n=30 kannst Du in einer multiplen Regression nicht viel machen, mehr als 2 bis 3 Prädiktoren sind da in einem Modell nicht sinnvoll zu verarbeiten, wobei dann auch noch kategoriale oder ordinalen Variablen mit k Stufen in k-1 Dummy-Prädiktoren umgewandelt werden müssen. Inhaltlich kann ich leider nicht viel dazu sagen, ich kenne den Gegenstandsbereich nicht und kann die hingeworfenen Begriffe nicht einordnen.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
kagemusha

Re: Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Do 3. Dez 2015, 13:15

Zunächst einmal vielen Dank für deine Antwort :-)
Was für ein statistisches Verfahren bietet sich denn deiner Meinung nach dafür an? Es werden leider nur 36 Beobachtungen, aber mind. 5 Prädiktoren müsste ich schon einbauen und diese sind alle skaliert.
Ich glaube, eine qualitative Arbeit zu dem Thema wäre besser gewesen :?
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression-Regressoren

Beitragvon PonderStibbons » Do 3. Dez 2015, 13:42

Wie gesagt konnte ich die Beschreibung der Studie nicht verstehen.
Daher kann ich auch nicht sagen, was sich an Datenanalysen anbietet,
um die Forschungsfragen zu beantworten, wie auch immer diese im
Detail aussehen mögen. Da Deine Prädiktoren, soweit ich es aufgeschnappt
habe, nicht oder nicht alle intervallskaliert sind, werden es eben
in einer Regression weitaus mehr als 5 Prädiktoren, was in der Regel bei
n=36 wenig Ertrag verspricht. Man müsste halt im vorhinein die Zahl
der Prädiktoren pro Modell aus theoretischen Gründen ausreichend
reduzieren.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
kagemusha

Re: Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Do 3. Dez 2015, 14:48

Also der Regressant ist intervallskaliert. Die Prädiktoren könnte ich auf 5 auf begrenzen. Allerdings hast du richtig verstanden, dass keiner davon intervallskaliert ist. Das ist grundsätzlich auch die wesentliche Denkleistung meiner Arbeit, ein sinniges Skalensystem für jeden Prädiktor zu finden, da keiner von diesen leicht zu quantifizieren ist. Jeder Dark Pool Betreiber steht vor der Entscheidung, wie Wertpapiertransaktionen in seinem Pool abgewickelt werden. Zum Beispiel: Werden gewisse Kundenklassen bevorzugt behandelt, d.h. wird die Bestellung eines Pensionsfonds der eines Hochfrequenzhändlers vorgezogen, obwohl die des Hochfrequenzhändlers früher eingegangen ist. Falls ja, so darf man annehmen, wird dieser Dark Pool für den HFT uninsteressanter. Die Frage ist aber, wie ich das auf den Prädiktor ummünze. Ich könnte es mir leicht machen indem ich sage, der Prädiktor für Kundenpriorisierung kann zwei Ausprägungen annehmen:
1. Pensionfonds > HFT
2. Pensionsfond = HFT
Damit werde ich der Sache aber nicht gerecht, da viele Dark Pools gewisse Zusatzregeln haben, sodass eine Priorisierung wie oben beschrieben nicht so leicht festzumachen ist. Im Falle des Credit Suisse Dark Pools wird grundsätzlich die Bestellung des Pensionsfonds bevorzugt behandelt, es sei denn, die Bestellung des HFT wird durch einen bestimmten Algorithmus an den Dark Pool gesendet.
Disen Eigenheiten muss ich bei der Skalierung des Prädiktoren natürlich Tribut zollen. Dann wären es nicht mehr 2 Ausprägungen, sondern mindestens 3:
1. Pensionfonds > HFT (geringe HFT Aktivität erwartet)
2.Pensionsfond > HFT, mit Ausnahme xy (mittlere HFT Aktivität erwartet)
3. Pensionsfond = HFT (hohe HFT Aktivität erwartet)
Kann ich eine Regression überhaupt mit Prädiktoren ausführen, die sämtlichst nach diesem Muster funktionieren? Wenn ja, welche ist für n=35 geeignet?
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression-Regressoren

Beitragvon PonderStibbons » Do 3. Dez 2015, 16:58

Kategoriale oder ordinale Variablen mit k Stufen werden für die Regression in
k-1 dummy-Variablen umgewandelt (eine der Stufen erhält keinen eigenen dummy).
Mit beispielsweise einer dichotomen und einer dreistufigen Variable erhälst
Du 1+2 Prädiktoren im Modell. Du kannst vielleicht einmal nach "rules of thumb"
oder "Faustregeln" für die Zahl der Prädiktoren in einer multiplen Regression
rechercheren.

Vielleicht machst Du auch einfach eine Serie bivarater Analysen (eventuell
mit Korrektur der Signifikanztests für multiples Testen) statt einem multiplen
Regressionsmodell.

Mit freundlichen Grüßen
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
kagemusha

Re: Multiple Lineare Regression-Regressoren

Beitragvon DHA3000 » Do 3. Dez 2015, 17:22

Wieso hast du nur ~30 Beobachtungen?

Du hast doch Tagesdaten für die Dark Pools. Daraus könnte man ein schönes Panel mit Dummys stricken.
Auf Monats oder Jahresbasis.
Wenn du aber keine Ahnung davon hast und nicht gewillt bist, dich einzuarbeiten, dann lass es.
DHA3000
Elite
Elite
 
Beiträge: 478
Registriert: So 8. Jul 2012, 15:08
Danke gegeben: 0
Danke bekommen: 62 mal in 62 Posts

Re: Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Do 3. Dez 2015, 18:29

Ich arbeite mich gerade ein, sonst wär ich ja nicht hier.
Ich habe nur 35 Beobachtungen, da die amerikanische Finanzbehörde nur Daten zu 35 Pools veröffentlicht. Mit den Wochendaten bestimme ich ja bereits den Wert des Regressanten. Die Datensätze erscheinen wöchentlich und geben an, welche Aktie in der Woche wie oft in den jeweiligen Dark Pools gehandelt wurde und wieviele trades stattgefunden haben. Damit kann ich die durchschnittliche trade-Größe bestimmen. Je niedriger diese ist, desto größer scheint die Aktivität von Hochfrequenzhändlern zu sein. Ich kann außerdem zu jeder Aktie die Marktkapitalisierung bestimmen, was einen weiteren kleinen Informationsgehalt birgt (HFT handeln bevorzugt mit liquiden Aktien, je größer die Marktkapitalisierung, desto liquider die Aktie). Das ist aber auch so ziemlich alles, was ich mit den Daten anfangen kann.

Bezüglich der Dummy-Variablen: Wird das nicht eher eingesetzt bei nominalen Variablen? Die Ausprägungen meiner Variablen haben ja durchaus eine gewisse Reihenfolge. Bei 5 Variablen mit jeweils mind. 4 Ausprägungen scheinen mir 35 Beobachtungen arg wenig.
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Re: Multiple Lineare Regression-Regressoren

Beitragvon PonderStibbons » Do 3. Dez 2015, 18:41

Ordinale Daten kann man nicht einfach wie intervallskaliert behandeln, daher das downgraden zum kategorialen Skalenniveau.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11367
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2503 mal in 2487 Posts

folgende User möchten sich bei PonderStibbons bedanken:
kagemusha

Re: Multiple Lineare Regression-Regressoren

Beitragvon kagemusha » Do 3. Dez 2015, 19:19

Also nochmal Danke an dieser Stelle für eure Hilfe. Trotz latenter Panik habe ich den Eindruck, gerade mehr über Statistik zu lernen als während meines gesamten Studiums.

Zu deinem Vorschlag bzgl. bivariater Analysen: Ist es "erlaubt" oder sogar sinnvoll, für jede Variable ein anderes Verfahren anzuwenden? Also bspw. für ordinale Regressoren Spearman's Rangkorrelationskoeffizient und für nicht ordinale Regressoren eine multinominale logistische Regression?

Vlt. wäre aber auch eine geordnete Probit Regression am geeignetsten, dann müsste ich nur den Regressanten ordinal skalieren, sehe ich das richtig?
kagemusha
Grünschnabel
Grünschnabel
 
Beiträge: 9
Registriert: Mi 2. Dez 2015, 14:38
Danke gegeben: 6
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 8 Gäste

cron