Umgang mit "Extremwerten" bei linearer Regression

Alle Verfahren der Regressionanalyse.

Umgang mit "Extremwerten" bei linearer Regression

Beitragvon Freddy19911 » Mo 23. Sep 2019, 19:29

Hallo,

ich möchte eine lineare Regression durchführen und bin mir vor allem bzgl. des Umgangs mit "Ausreißern" der abhängigen Variable unsicher: Die Ausprägungen meiner abhängigen Variable sind tägliche Aktienrenditen von unterschiedlichen Unternehmen (R_i). Zunächst einmal möchte ich prüfen, ob sich die Renditen zwischen verschiedenen Typen von Unternehmen unterscheiden. Ich habe also einen Dummy x_1 (1= Unternehmen aus Finanzsektor), (0=Sonstiger Sektor) als erklärende Variable definiert.

Als nächstes versuche ich nach und nach die Annahmen der einfachen linearen Regression zu prüfen. Zunächst habe ich mir einen Überblick über die Häufigkeitsverteilung meiner abhängigen Variable verschafft (s. Anhang). Scheinbar existieren einige "Extremwerte", was sich auch durch einen Boxplot bestätigt. Ich frage mich nun wie ich mit solchen Werten umgehe. Einer dieser "Extremwerte" ist bspw. eine Rendite von 15%. In Relation zu den anderen Renditen ist dies natürlich hoch. Jedoch entspricht dieser Anstieg des Kurses bspw. eine Steigerung des Aktienkurses von 10 EUR auf 11,5 EUR, was in der Grundgesamtheit evtl. gar keine Seltenheit darstellt. Eine weitere Annahme der linearen Regression ist die Normalverteilung der Residuen. Im angehängten QQ-Plot sind diese nach Bereinigung der Ausreißer "normalverteilter" als mit den Ausreißern. Sprich dies schon für die Entfernung der extremen Beobachtungen?

Ich bin mit dem Umgang der Ausreißer ein wenig überfordert und hoffe jemand kann mir hier weiterhelfen.

PS: Da das Kontingent für Dateianhänge ausgenutzt ist, muss ich die Bilder extern hochladen.

Bild

Verteilung der Residuen
Bild

Grüße
Freddy19911
Mitglied
Mitglied
 
Beiträge: 25
Registriert: Mi 20. Jun 2018, 19:44
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit "Extremwerten" bei linearer Regression

Beitragvon Holgonaut » Sa 28. Sep 2019, 13:04

Hi,

kannst du über die AV Aktionrendite was sagen? Mir kommt es vor, dass das keine (konzeptionell) normalverteilte Variable ist, weil das Minimum 0 sein dürfte. Das sieht eher wie ne Gamma-Verteilung aus. Ich hatte das vor kurzem und meine qq-plots sahen aus wie Deine. Abhilfe schafft ein generalisiertes lineares Modell mit Gamma-Fehlerverteilung. Ist in R leicht möglich:
https://stats.stackexchange.com/questio ... stribution

Grüße
Holger
Holgonaut
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 767
Registriert: Do 2. Jun 2011, 18:20
Danke gegeben: 3
Danke bekommen: 207 mal in 198 Posts

Re: Umgang mit "Extremwerten" bei linearer Regression

Beitragvon strukturmarionette » So 29. Sep 2019, 00:40

strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4352
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts


Zurück zu Regressionanalyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste

cron