Liebes Forum,
ich führe aktuell eine Regressionsanalyse durch und möchte gerne, zur Einschränkung der Autokorrelation in den Fehlertermen meine Beobachtungen clustern.
Zu meinen Daten:
Ich habe Beobachtungen (Kurse etc.) von 70 Aktien, über zwei Monte hinweg, als 5-Minuten Daten (also 5-Minuten Daten fortlaufend für zwei Monate für jedes Unternehmen).
Jetzt habe ich zwei Möglichkeiten zum Clustern:
1. Clusterung nach Unternehmen: Dann habe ich sehr große Cluster mit ca. 4400 Beobachtungen je Cluster (=Unternehmen), bei Regressionsanalysen mit 60000-90000 Beobachtungen.
Pro: Autokorrelation wird für jedes Unternehmen im Laufe des gesamten Betrachtungszeitraums eingeschränkt.
Contra: Zu große Cluster können auch schon bei wenig Autokorrelation meine Datenmenge stark einschränken, d. h. die Standardfehler der Koeffizienten übermäßig stark in die Höhe treiben.
2. Clusterung nach Unternehmen und Tag:
Pro: Kleinere Cluster, höhere Intra-Klassenkorrelation als auch Unternehmensebene im gesamten Betrachtungszeitraum
Contra: Es wird unterstellt, dass die Kurse über verschiedene Tage miteinander unkorreliert sind und die Unternehmen untereinander nicht korrelieren.
Ich tendiere zur zweiten Möglichkeit und möchte die Ergebnisse dann eher konservativ auswerten.
Fahre ich so richtig oder habe ich wesentliches nicht bedacht?
Bin dankbar für jede Hilfe.