OLS Regression - Bedingung der Normalverteilung, Ausreißer

Fragen, die sich auf kein spezielles Verfahren beziehen.

OLS Regression - Bedingung der Normalverteilung, Ausreißer

Beitragvon Boomstriker » Fr 4. Sep 2015, 18:04

Hallo Freunde der Statistik,

ich habe drei kleinere Fragen zur Erstellung einer Regression mit dem OLS Ansatz.

Der Stichprobenumfang meiner Untersuchungen ist meist zwischen n=66 und n=550. Der Funktionale Aufbau meist nur eine oder zwei Dummys (y =a + D1 * x + u).

Meistens sieht der Q - Q Plot so aus wie auf dem Bild der Fall ganz links.

Bild

(1) Ist das noch normalverteilt oder nicht, weil es zu sehr von der Geraden abweicht?

(2) Stimmt es, dass bei einem so großen Beobachtungsumfang (>n=50) die Residuen nicht mehr normalverteilt sein müssen? Ich habe dies nun schon mehrmals gelesen. Wenn ja, wie heißt die Grundlage dafür. Ich frage, da ich die Ergebnisse und Annahmen mit Quellen belegen muss.

(3) Bei der Behandlung von Ausreißern bin ich auf zwei Methoden gestoßen. Die erste besagt, Ausreißer löschen und die Regression nochmal machen. Die zweit besagt, eine andere Methode verwenden und zwar die "Robuste Regression". Hier werden die Beobachtungen mit größeren Residuen weniger stark gewichtet. Welche dieser zwei Methoden ist ratsam?

Vielen Dank für eure Hilfe!

Boom
Boomstriker
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 4. Sep 2015, 17:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: OLS Regression - Bedingung der Normalverteilung, Ausreiß

Beitragvon PonderStibbons » Fr 4. Sep 2015, 21:41

(2) Stimmt es, dass bei einem so großen Beobachtungsumfang (>n=50) die Residuen nicht mehr normalverteilt sein müssen? Ich habe dies nun schon mehrmals gelesen. Wenn ja, wie heißt die Grundlage dafür.

Zentraler Grenzwertsatz.

Welche dieser zwei Methoden ist ratsam?

Je nachdem.

Mit freundlichen Grüßen

p.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: OLS Regression - Bedingung der Normalverteilung, Ausreiß

Beitragvon Boomstriker » Sa 5. Sep 2015, 00:40

Vielen Dank für die Antwort. Zentraler Grenzwertsatz, das ist es :idea: .

Je nachdem.


Bei mir handelt es sich um eine Analyse von Kalenderanomalien am Aktienmarkt auf Basis monatlicher Wertentwicklungen. Ausreißer sind hier meist irgendwelche Weltwirtschaftskrisen, welche die Finanzmärkte ins straucheln brachten und so die Regression in die ein oder andere Richtung drehten. Es handelt sich somit nicht um Messfehler, sondern um in der Realität aufgetretene Werte.
Kannst du mir nun genauer sagen, welche der zwei Methoden sinnvoller ist?

Vielen Dank!
Boomstriker
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 4. Sep 2015, 17:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: OLS Regression - Bedingung der Normalverteilung, Ausreiß

Beitragvon Boomstriker » So 6. Sep 2015, 16:32

Hat sonst keiner mehr eine Antwort auf meine Fragen?
Boomstriker
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 4. Sep 2015, 17:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: OLS Regression - Bedingung der Normalverteilung, Ausreiß

Beitragvon PonderStibbons » So 6. Sep 2015, 17:22

Das hängt doch von inhaltlichen Gesichtspunkten ab (will und kann man solche Ereignisse herausnehmen oder nicht, was kann man dann noch aussagen, wenn man sie herausnimmt), sowie von den Gepflogenheiten des Faches. Du kannst womöglich auch einfach alle 3 Modelle rechnen und sie vergleichen.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: OLS Regression - Bedingung der Normalverteilung, Ausreiß

Beitragvon Boomstriker » So 6. Sep 2015, 18:39

Danke PonderStibbons. Das mit dem Vergleich ist eine gute Idee!

Das mit dem zentralen Grenzwertsatz finde ich etwas komisch, vllt kann mich hier jemand aufklären. Bei meiner Analyse kam heraus, dass die Residuen offensichtlich nicht normalverteilt sind. Der Grenzwertsatz besagt nun, dass das egal sei, da n>50 und sich bei großen n jede Verteilung der Normalverteilung annähert.

Das was ich nicht verstehe ist, ich habe doch mit meinem n was größer als 50 war gerechnet und herausbekomen, dass es keine Normalverteilung ist. Was bringt es mir da zu wissen, dass sich eine Verteilung der Normalverteilung nähert, sie es aber offensichtlich nicht ist?
Boomstriker
Grünschnabel
Grünschnabel
 
Beiträge: 4
Registriert: Fr 4. Sep 2015, 17:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: OLS Regression - Bedingung der Normalverteilung, Ausreiß

Beitragvon PonderStibbons » So 6. Sep 2015, 19:11

Der Grenzwertsatz besagt nun, dass das egal sei, da n>50 und sich bei großen n jede Verteilung der Normalverteilung annähert.

Der Grenzwertsatz sagt nichts dergleichen. Der macht Aussagen darüber, wie sich die Parameter von Stichproben verteilen, nicht über die Verteilung von Rohwerten. Und die Parameter von Stichproben sind es, über die man Tests rechnet.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 16 Gäste